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(57) Abstract: Disclosed is a method for detecting additional rele- 
vant resources in relation to a predefined initial number of resources, 
consisting of the following steps: a) a set of referencing resources 
consisting of all resources being linked to at least one of the initial 
resources is detected; b) a set of potential resources consisting of all 
resources referenced by the referencing resources is established; c) 
for each potential resource, a potential-resource relevance score is 
calculated between said potential resource and all initial resources 
on the basis of existing links in the referencing resources to the po- 
tential resource and the initial resources, and also on the basis of 
the relevance scores of referencing resources assigned to each refer- 
encing resource; d) for each referencing resource, a referencing-re- 
source relevance score is recalculated on the basis of links occurring 
in said referencing resource to the potential resources and also on the 
basis of the potential-resource relevance score assigned to the poten- 
tial resources in step c); e) step c), and if necessary several times step 
d) followed by step c), is repeated if necessary; f) said additional rel- 
evant resources are identified as the potential resources having the 
highest potential-resource relevance scores. 

(57) Abrege : Un proc^d^ pour determiner des ressources addition- 
nelles pertinentes par rapport k un ensemble dotm^ de ressources de 
depart comprend les Stapes suivantes : a) identifier un ensemble de 
• ressources citantes constitutes par toutes les ressources ayant un lien 
Vers au moins Tune des ressources de depart, b) former un ensemble 
de ressources candidates constitut par T ensemble des ressources ci- 
t^s par les ressources citantes, c) pour chaque ressource candidate, 
calculer un score de pertinence de ressource candidate entre ladite 
ressource candidate et T ensemble de ressources de depart sur la base 
de I'existence de 
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liens situ6s dans les ressources citantes et dirig^s vers la ressource candidate et vers les ressources de depart, et sur la base ^galement 
de scores de pertinence de ressources citantes affect^s ^ chacune des ressources citantes, d) pour chaque ressource citante, recalculer 
un score de pertinence de ressource citante sur la base de Texistance, dans la ressource citante en question, de liens vers les ressources 
candidates et sur la base 6galement des scores de pertinence de ressource candidate attributes aux ressources candidates h. Tttape c), 
e) rtptter le cas tchtant Tttape c) et le cas ^h^t une ou plusieurs fois Tttape d) puis Tttape c), f) determiner lesdites ressources 
additionnelles pertinentes conuiie 6tant les ressources candidates qui prtsentent les meilleurs scores de pertinence de ressource can- 
didate. 
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« Proc6d6s et systdmes de recherche et d'association de ressources d'information telles que des 
pages Web » 

La pr&ente invention conceme d'une fa9on g6n^rale des precedes et systemes de gestion de 
5 ressources telles que des pages Web accessibles par Tlntemet, ou tous autres types de 
documents, visant d'une part a am^liorer robtention de ressources « proches » de ressources 
donn6es, en termes notaniment de centres d'int^rSts pour futilisateur, «t visant d'autre part k 
permettre a Tutih'sateur, d'une maniere particuli^rement simple et intuitive, d'effectuer lui-meme 
des associations entre ressources, notamment pour en tirer parti lors de I'obtention de ressources 
10 proches. 

L'etat de la technique 

La quantity d'infonnation potentiellement pertinente pour chaque individu devient telle que les 
methodes actuelles de memorisation et de recherche d'information ne sont gueres suffisantes. A 
cote des systemes permettant de retrouver une information rangee explicitement (tels que les 
15 « liens favoris ») ou par mots-cle (via un moteur de recherche), on souhaiterait avoir h 
disposition un proc^d^ qui spontanfiment propose des Informations pertinentes en fonction du 
contexte. 

On connait les systemes qui fournissent des liens pertinents (ou plutot « related links » en 
20 terminologie anglo-saxonne) par rapport h une page courante visitee sur le Web. Typiquement 
ces systemes comprennent une extension au navigateur Internet qui communique avec un serveur 
distant qui foumit les liens pertinents en fonction de la page courante presentee dans la fenStre 
principale du navigateur. Typiquement ces liens sont presentes, sous la forme d'une liste d'URL, 
dans une fenetre adjacente a la fenetre principale du navigateur. 

25 €ependant de tels systemes ne sont pas etendus pour servir de m6moire associative. 

R6sume de T invention 

Un objet de la presente invention est de proposer des proc6d6s et systemes informatiques de 
recherche de ressources (notamment pages Web, documents informatiques divers) « proches » de 
ressources donn^es (cette notion de proximity 6tant «xplicit6e plus loin), ainsi que des precedes 
30 de gestion associative de ressources. 

En particulier, I'invention vise a caract^riser des Elements d' information par rapport k de 
nouvelles pages qui apparaissent sur le Web, ouvrant ainsi la voie k de multiples nouvelles 
applications de gestion dynamique de contenu par rapport au contexte de navigation de 
rutilisateur. 

35 Plus precisement, Pinvention vise a ce qu'a chaque Element d'information soient associes des 
liens sur des pages Web pertinentes qui le caract&isent et qui sont automatiquement tenus a jour. 
On pent ainsi caract6riser des informations non textuelles, comme les photos, les sons et les 
animations (en Flash, etc.) et s61ectionner dynamiquement les Elements k presenter a Tutilisateur 
en fonction du contexte de sa navigation qui est egalement caracterisee par des ensembles de 

40 pages Web pertinentes. Cette approche convient notamment, mais non exclusivement, aux 
magazines dans Tart de vivre, la mode et dans tous les autres domaines "de gouts" ou il est 
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difficile de caracteriser par des mots-.cI6 Tint^rSt qu'un abonnd porte ^ Tinformation (quand par 
exemple elle represente une musique, un objet d*art, un plat culinaire, etc). 

Un autre objet de I'invention est d'associer k des elements d' informations d'autres elements 
cibl6s, tels que des publicit6s ciblees, en ^change d'un service innovant de m^moire associative 
5 offert aux intemautes. 

En particulier, on vise a ce que, typiquement au moyen d'une extension de leur navigateur 
(extension t^lechargeable a partir d*un site Web donne), Jes utilisateurs puissent utiliser les 
elements d' information de ce site comme « m6moire associative ». Ainsi, pendant la navigation 
de I'utilisateur, I'^l^ment le plus pertinent du site par rapport h la page Web visit6e - ainsi que par 

10 rapport au contexte de navigation - lui sera spontan6ment pr6sente; Tutilisateur pourra alors 
giisser-d6poser sur cet element n' importe quelle ressouroe de son ordinateur, telle que ric6ne 
d'un fichier du poste client, ou encore VURL d'une page Web, pour la memoriser. Ensuite, a 
chaque fois qu'il va visiter une page Web quelconque mais peirtinente par rapport h cet element, 
la ressource qu'it avait m^morisee lui sera spontanement presentee, avec en plus les ressQurces 

15 (telles que des publicit^s) que Tauteur de Telement avait lui-menie associe h I'element. Les 
publicit^s presentees correspondront ainsi aux centres d'interet courants de I'utilisateur et sont 
foumies en ^change d'un nouveau service de m6moire associative. 

LMnvention vise par ailleurs h mettre a profit les interfaces utilisateurs modemes pour cr6er, 
d'une mani^re particulierement simple et intuitive, des .associations entre ressources 
20 d' informations (pages Web, ou fichiers de documents) notamment dans le cadre des objectifs ci- 
dessus. 

L'invention propose selon un premier aspect un proc6d6 pour d6terminer des ressources 
additionnelles pertinentes par rapport a un ensemble donn^ de ressources de depart, caract^rise 
en ce qu'il comprend les Stapes suivantes 
25 a) identifier un ensemble de ressources citantes constituees par toutes les ressources ayant 

un lien vers au moins Tune des ressources de depart, 

b) former un ensemble de ressources candidates constitu6 par Tensemble des ressources 
citees par les ressources citantes, 

c) pour chaque ressource candidate, calculer un score de pertinence de ressource 
30 candidate entre ladite ressource candidate et I'ensemble de ressources de depart sur la base de 

^existence de liens situ6s dans les ressources citantes et diriges vers la ressource candidate et 
vers les ressources de depart, et sur la base ^galement de scores de pertinence de ressources 
citantes affect6s h chacune des ressources citantes, 

d) pour chaque ressource citante, recalculer un score de pertinence de ressource citante 
35 sur la base de Texistence, dans la ressource citante en question, de liens vers les ressources 

candidates et sur la base 6galement des scores de pertinence de ressource candidate attributes 
aux ressources candidates a Tttape c), 

e) reptter le cas tchtant Tttape c) et le cas 6cheant une ou plusieurs fois l'6tape d) puis 
rttape c), 

40 f) determiner lesdites ressources additionnelles pertinentes comme etant les ressources 

candidates qui pr6sentent les meilleurs scores de pertinence de ressource candidate (et le cas 
6ch6ant 6galement les ressources citantes qui pr6sentent les meilleurs scores de pertinence de 
ressource citante). 



wo 2003/057648 ^^/FR2003/000089 



Le calcul de score de pertinence effectu6 k I'^tape c) avantageusement comprend le calcul d'une 
pluralite de sommes de scores de pertinence de ressources citantes, chaque somme comprenant 
uniquement les scores de pertinences des ressources citantes comprenant un lien vers une 
ressource donnee constitute par la ressource candidate ou une ressource de depart. 

5 De fa9on pr6fer6e, le proc6d6 ci-dessus comprend 6galement le calcul d'au moins une somme de 
scores de pertinence de ressources citantes, chaque somme comprenant uniquement les scores de 
pertinences des ressources citantes comprenant un lien vers I'uneparmi un ensemble d'au moins 
deux ressources donntes, cet ensemble comprenant la ressource candidate 'et au moins une 
ressource de depart. 

10 Selon un deuxieme aspect, rinvention propose un proc6d6 pour dtterminer des ressources 

additionnelles pertinentes par rapport a un ensemble donn6 de ressources de depart, caracttrise 

en ce quMl comprend les etapes suivantes 

a) identifier un ensemble de ressources citees constituees par toutes les ressources ayant 

un lien depuis au moins Tune des ressources de depart, 
15 b) former un ensemble de ressources candidates constitue par r<ensem;ble des ressources 

citant les ressources cities, 

c) pour chaque ressource candidate, calculer un score de pertinence de ressource 
candidate entre ladite ressource candidate et T ensemble de ressources de depart sur la base de 
I'existence de liens situes dans la ressource candidate et dans les ressources de depart et dirig6s 

20 vers les ressources cities, et sur la base egalement de scores de pertinence de ressources cittes 
affectts k chacune des ressources cities, 

d) pour chaque ressource citte, recalculer un score de pertinence de ressource cit6e sur la 
base de I'existence, dans la ressource citee en question, de liens depuis les ressources candidates 
et sur la base Egalement des scores de pertinence de ressource candidate attribuees aux ressources 

25 candidates k Tttape c), 

■e) rdptter ie cas echtant I'etape c) et le cas 6ch6ant une ou plusieurs fois Tttape d) puis 
rttape c) 

f) determiner lesdites ressources additionnelles pertinentes comme etant les ressources 
candidates qui prdsentent les meilleurs scores de pertinence de ressource candidate (et le cas 
30 tchtant tgalement les ressources cities qui pr6sentent les meilleurs scores de pertinence de 
ressource cit6e). 

L'invention propose en outre un systeme de navigation parmi des ressources d' information, 
chaque ressource comprenant au moins un lien activable dans un premier mode par un dispositif 
d'entrte pour provoquer Taccfes k une autre ressource d' informations d6sign6e par un 
35 identificateur de ressource associe a ce lien, caracterise en ce qu'au moins certaines ressources 
comprennent au moins un lien activable dans un second mode k Taide d'un dispositif d'entr6e 
pour envoyer k un moteur de recherche de nouvelles ressources d' informations une requSte de 
recherche contenant P identificateur de ressoxirce associ6 au lien en question. 

Ce systfeme pr6sente les aspects pr6f6r6s mais facultatifs suivants : 
40 * le dispositif d'entree est apte k activer le lien simultandment dans les premier et second 

modes. 
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* Tactivation du lien dans le second mode est apte k provoquer raffichage d'une requete 
pr^-existante, k laquelle Fidentificateur de ressource associ6 au lien en question est susceptible 
d'etre ajoute. 

* Tactivation du lien dans le second mode est apte a afficher, en plus de la requete pr6- 
5 existante, la ressource d' informations d6sign6e par ledit identificateur de ressource. 

L'invention propose ^galement un systfeme de recherche de nouvelles ressources d'information a 
partir de ressources d' informations existantes, caracteris^ en ce qu'il comprend un moteur de 
recherche bas6 sur T analyse de liens entre differentes ressources et acceptant en entree une 
requete comprenant une s6rie dMdentificateurs de ressources, un moyen de selection 
10 d'identificateurs apte a m6moriser un ensemble d'identificateurs (URI) de ressources 
s^lectionnes les uns aprds les autres par un utilisateur, et un moyen g^n^rateur de requete 
activable par Tutilisateur. pour engendrer une requSte contenant Tensemble des identificateurs 
precddemment s61ectionn6s h destination du moteur de recherche, 

De fa9on pr6f6r6e mais non limitative, le moyen de selection est apte a m^moriser les 
15 identificateurs selectionnes de maniere rSmanente, de telle sorte que le moyen de selection puisse 
etre mis en oeuvre de fa9on espacde dans le temps en vue de la generation d'une meme requete. 

L' invention propose par ailleurs un precede de recherche de nouvelles ressources d' information a 
partir de ressources d 'informations existantes, caracterisd en ce qu'il comprend la mise en ceuvre 
d'un moteur de recherche bas6 sur Tanalyse de liens entre differentes ressources et acceptant en 
20 entree une requete comprenant une s6ne d' identificateurs de ressources et en ce qu'il comprend 
les etapes suivantes : 

- selection d' identificateurs (URI) de ressources les uns apres les autres par un 
utilisateur ; 

- g6n6ration d'une requgte contenant I'ensemble des identificateurs pr^cedemment 
25 selectionnfe h destination du moteur de recherche. 

II est egalement propose un precede de recherche de nouvelles ressources d' information a partir 
de ressources d'informations existantes, caracterise en ce qu'il comprend la mise en ceuvre d'un 
moteur de recherche has6 sur I'analyse de liens entre differentes ressources et acceptant en entree 
une requete comprenant une s6rie d'identificateurs de ressources et en ce qu'il comprend les 
30 etapes suivantes : 

- generation d'une requete contenant un ensemble d'identificateurs de ressources 
precedemment memorises dans un meme groupe d'identificateurs de ressources propre k un 
utilisateur, k destination du moteur de recherche, 

- generation d'une signalisation k I'attention de I'utilisateur lorsqu'au moins un nouvel 
35 identificateur de ressource appartenant au groupe en question a ete trouve par le moteur. 

Selon un aspect pref6re du precede ci-dessus, chaque groupe d'identificateurs de ressources est 
represente par un objet graphique sur un dispositif d'affichage de I'utilisateur, et en ce que ladite 
signalisation est r6alisee au moins par changement d'apparence de cet objet graphique. 
L'invention propose en outre un precede de gestion de ressources dans un systeme informatique 
40 pourvu d'un ecran d'affichage et d'un dispositif d'entr^e pour ddplacement et actionnement de 
curseur tel qu'une souris, chaque ressource poss^dant une representation affichee sur 1' ecran de 



wo 2003/057648 



/FR2003/000089 



5 

manidre k pouvoir 6tre d^plac^e k Taide du dispositif d'entr^e, proc6d6 caracteris^ en ce quMl 
comprend les Stapes suivantes : 

- deplacement de la representation d'une premiere ressource pour I'amener au-dessus de 
la representation d'une seconde ressource, 

5 - puis memorisation, dans une memoire de gestion associative de ressources, 

d' informations d' association entre les premiere et deuxiSme ressources- 
Certains aspects pr^fer^s, mais facultatifs, de ce proc6d6 sont les suivants : 

* r etape de deplacement est effectude par une technique de glisser-deposer. 

* le proc6d6 comprend en outre, suite k T identification d'une ressource donn6e dans un 
10 processus de consultation de ressources, les etapes suivantes : 

- lecture de la memoire de gestion associative de ressources pour determiner si k ladite 
ressource donnee sont associees d'autres ressources, et 

- dans r affirmative, signalisation sur I'^cran d'affichage de Texistence de la ou des 
ressources associees. 

15 * les ressources comprennent des fichiers. 

* les ressources comprennent des ressources accessibles par un reseau tel que P Internet. 

* ^identification d'une ressource donn6e est obtenue par un processus dMdentification de 
ressources similaires ou pertinentes par rapport a au moins une ressource de depart. 

* dans le cas oil la lecture de la memoire de gestion associative determine Texistence de 
20 plusieurs ressources associees, I'etape de signalisation comprend la signalisation ordonnee d'au 

moins une partie desdites plusieurs ressources associees. 

* la signalisation ordonnee est basee sur la determination de scores de pertinence desdites 
ressources associees. 

* la memoire de gestion associative de ressources est contenue dans un serveur accessible a partir 
25 d'une pluralite de postes individuels dans lesquels retape de deplacement peut dtre mise en 

OBUvre. 

* les associations entre ressources sont memorisees utilisateur par utilisateur. 

* les associations entre ressources sont memorisees de fajon mutualisee entre plusieurs 
utilisateurs. 

30 L'invention propose egalement un precede pour identifier a partir d'une ressource de texte, une 
partie de ladite ressource susceptible de constituer une requSte significative pour un moteur de 
recherche, caracterise en ce qu'il comprend les 6tapes suivantes : 

- 6ter du texte les mots non significatifs ; 

- etablir et completer une memoire de liens entre parties dudit texte, oti une partie est liee k une 
35 autre quand elle contient au moins un mot significatif en commun ; 

. mettre en oeuvre un precede de determination de scores de ressources par analyse d'un graphe 
de nosuds de ressources reli6s par des liens, oix chaque ressource utilisee dans ce procede est 
constituee par une partie du texte, sur les parties de texte ainsi liees entre elles ; 
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- utiliser au moins Tune des parties de texte constitutes par les ressources candidates dtterminees 
par ledit precede comme texte de requSte ou comme base pour un texte de requSte. 

Avantageusement, I'ttape de mise en cBuvre du precede de distillation de ressources est effectuee 
seulement avec des parties de texte selectionndes comme pr6ponderantes, ou les parties de texte 
5 citantes sont les parties de texte qui comprenant au moins un mot en commun avec la ou les 
parties de texte prepond6rantes, ou un lien est cre6 k partir de chaque partie de texte citante vers 
la ou les parties de texte prtpondtrantes, ou les parties de texte contenant au moins un mot 
tgalement contenu dans les parties de texte citantes sont identifites, pour former un groupe de 
parties de texte co-cit6es, et ou est temporairement cre6 un lien k partir de chaque partie de texte 
10 citante vers chaque partie de texte co-citee avec laquelle ladite partie de texte citante possdde au 
moins un mot en commun. 

Les parties de texte sont typiquement des phrases. 

Selon un autre aspect, T invention propose un procede de gestion de ressources d' information 
telles que des pages Web dans un systfeme informatique comprenant un poste utilisateur dot6 
15 d'tm ecran d*affichage, chaque ressource possedant un identifiant (URI) permettant son accfes a 
partir du poste utilisateur, precede caracterise en ce qu'il comprend les etapes suivantes : 

(a) declaration par Tutilisateur d'une association entre deux ressources, en associant a une 
deuxi^me ressource I'identificateur d'une premiere ressource ; 

(b) identification d'autres ressources pertinentes par rapport k la deuxifeme ressource ; et 

20 (c) lors de Tacces a Tune des autres ressources (page courante)^ signalisation de 

1 'existence de la premiere ressource. 

Selon certains aspects pr6f6rds mais non limitatifs : 

* Tetape (b) comprend la selection d'autres ressources les plus pertinentes pour la mise en oeuvre 
de I'etape (c). 

25 * I'etape (a) est mise en ceuvre pour une plurality de deuxiemes ressources appartenant a un 
groupe, et en ce que I'etape (b) comprend 1' identification d'autres ressources pertinentes par 
rapport i r ensemble des deuxiemes ressources du groupe. 

* Tdtape (b) est dtclenchfe par la realisation de Tttape (a). 

* Petape (b) est mise en oeuvre posttrieurement k I'accfes pr6vu k Tttape (c) pour determiner si 
30 I'autre ressource a laquelle il a ete acc6de est une autre ressource pertinente par rapport k la 

deuxieme ressource. 

* Tetape (b) est mise en oeuvre par foumiture d'un identificateur de la deuxieme ressource k un 
serveur de determination de ressources pertinentes. 

* Tetape (b) est mise en oeuvre par identification d'autres ressources pertinentes par rapport k au 
35 moins une ressource intermediaire {spot) par rapport a laqfuelle la deuxieme ressource est 

prtdeterminee comme ttant pertinente. 

* le procede comprend en outre I'affichage, au voisinage d'une zone d'affichage de ressources, 
de representations de liens vers au moins certaines parmi les premieres ressources, les ressources 
intermediaires, et des ressources pertinentes par rapport aux ressoiirces intermediaires. 

40 * retape (a) est mise en oeuvre par action k I'aide d'un dispositif d'entrte sur des objets 
graphiques reprtsentatifs des premiere et deuxieme ressources. 
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LMnvention propose par ailleurs un proc6de pour identifier des ressources d' informations 
accessibles par liens (telles que des pages Web) r^centes, pertinentes par rapport k au moins une 
ressource donnee, caracteris^ en ce qu'il comprend les Stapes suivantes : 

- appiiquer une requete coraprenant un identificateur de ladite ressource donnee k un syst^me de 
5 determination de pertinence entre ressources, 

- s61ectionner un premier ensemble de ressources les plus pertinentes (e.g. meilleurs scores 
pivots) par rapport a ladite ressource donnee, 

- rechercher, dans cfeacune des ressources les plus pertinentes, des regions possedant des liens 
vers d'autres ressources de pertinence 61ev6e en moyenne, dites regions pertinentes, 

10 - surveiller 1' apparition, dans lesdites regions pertinentes, de nouveaux liens qui pointent vers des 
ressources qui n'etaient pas encore connues du systfeme, dites nouvelles ressources, 

- s61ectionner un deuxi^me ensemble de ressources ayant une pertinence 61evee (e.g. meilleurs 
scores autoriti hyperiexte) par rapport h ladite ressource donnee, 

- s^ lectionner les nouvelles ressources qui ont une similarity de contenu la plus ^levee par rapport 
15 aux ressources dudit deuxieme ensemble de ressources et donner aux nouvelles ressources 

selectionn^es un niveau de pertinence (score autorite de similarite) dependant du temps en 
fonction de ladite similarity de contenu. 

Selon un autre aspect encore, Tinvention propose un proc6d6 pour permettre Paccfes par un 
utilisateur a des d'entites d' informations pertinentes a partir d'une entite d* informations de 
20 depart, chaque entite d' informations etant accessible par un identifiant (URJ), caracterise en ce 
qu'il comprend les etapes suivantes : 

a) prevoir au moins une entite d' informations similaire, pr^sentant un contenu similaire i oelui de 
Tentlty de ddpart, et determiner IMdentifiant de la ou de chaque entity d'informations similaire, et 

ib) determiner k partir du ou de chaque identifiant d'entite d' informations similaire un ensemble 
25 d'un ou plusieurs identifiants d'entites d' informations pertinentes par rapport a la ou chaque 
-entite d' informations similaire. 

Des aspects pr^feres, xnais non limitatifs du procede ci-dessus sent les suivants : 

* le procede comprend en outre I'etape suivante : 

c) permettre k Tutilisateur Tacc^s a au moins certaines informations pertinentes a partir de leurs 
30 identifiants respectifs. 

* le proc6d6 comprend en outre retape suivante : 

d) a partir des identifiants d'entites d' informations pertinentes et d'un ensemble donne d'entitfe 
d'informations suppldmentaires, seiectionner les entit6s supplementaires les plus similaires aux 

35 entites d'informations pertmentes. 

* le precede comprend une etape supplementaire de tri des entites d' informations pertinentes par 
degre de pertinence. 
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* r^tape de tri est pr6c6d6e d'une '6tape de calcul d'un score de pertinence par rapport k la ou 
chaque entite dMnformations similaires pour chacune des entitds d' informations pertinentes. 

* chaque entite d'informations «st constituee par un fragment de page ecrite en langage de 
5 marquage normalise, ou par une telle page dans son ensemble. 

* chaque identifiant est constitu6 par un identificateur uniforme de ressource (URI) du fragment 
oudelapage. 

10 * Vitape a) est r^alis^e par selection par i'utilisateur d'une ou plusieurs entit6s dMnformations 
similaires k Pentite d'informations de depart. 

* Tetape a) est rSalisee par mise en ceuvre d'un processus de determination automatique d'entites 
d'informations similaires. 

15 

* r^tape a) est r6alisee par mise en ceuvre d'un processus de determination automatique d'entit^s 
d'informations similaires^ suivie d'une selection par I'utilisateur d'une ou plusieurs entitfe 
d'infomiations similaires parmi les entitfe d'informations similaires d6termin6es par Jedit 
processus. 

20 

* I'^tape b) est r^alisee par mise en ceuvre d'un processus de determination automatique d'entit6s 
d'informations pertinentes. 

* le processus de determination automatique d'entites d'informations pertinentes comprend 
I'analyse d'une structure de graphe d'identifiants constitu6e par les identifiants d'entites 

25 d'informations et par les identifiants designes par des liens activables par rutilisateur contenus 
dans lesdites entites d'informations. 

Selon un autre aspect de 1' invention, un procede pour determiner des scores de pertinence 
d'unites de. texte telles que des phrases dans un document textuei, comprend les etapes 
30 suivantes : 

- decomposition du document en une pluralite d'unites de texte, 

- selection d'au moins une unite de texte pertinente et d'unites de texte candidates, 

- determination de I'ensemble des mots signifiants contenus dans I'unite (ou les unites) de 
texte pertinente(s) et dans chacune des unites de texte candidates, 

35 . pour chaque mot signifiant contenu dans I'unite (ou les unites) de texte pertinente(s), 

identification des unites de texte candidates citant ce mot signifiant, pour former un groupe 
d'unites de texte citantes, 
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- identification des unites de texte candidates contenant au moins un mot signifiant 
^galement c\t€ dans les unites de texte citantes, pour former un groupe d'unit^s de texte co- 
cities, 

- affectation aux unites de texte co-cit6es un score de pertinence en fonction desdites 
5 citations. 

LMnvention propose aussi un proc^d6 pour determiner des scores de pertinence d'unit^s de texte 
telles que des phrases dans un document textuel, caract6ris6 en ce quMl comprend les Stapes 
suivantes : 

10 - decomposition du document en une pluralite d'unit6s de texte, 

- selection d'au moins une unite de texte pertinente et d'unites de texte candidates, 

- determination de 1' ensemble des mots signifiants contenus dans runlt6 (ou les unites) de 
texte pertinente(s) et dans chacune des unites de texte candidates, 

- pour chaque mot signifiant contenu dans runite (ou les unites) de texte pertinente(s), 
15 identification des unites de texte candidates comprenant ce mot signifiant, pour former un groupe 

d'unites de texte citds, 

- identification des unites de texte candidates contenant au moins un mot signifiant 
egalement cite dans les unites de texte cites, pour former un groupe d'unites de texte co-citantes, 

- affectation aux unites de texte co-citantes un score de pertinence en fonction desdites 
20 citations. 

52. Procede pour determiner des scores attribues k des mots ou groupes de mots contenus 
dans des unit6s de texte telles que des phrases dans un document textuel, caracterise en ce quMl 
comprend une etape qui consiste a additionner les scores de pertinences, determines par Tun des 
precedes ci-dessus, des unites de texte dans lesquels lesdits mots se trouvent. 

25 

Breve description des dessins 

Les figures 1 a 7 des dessins annexes illustrent differentes etapes mises en deuvre dans la presente 
invention. 

30 Description detailiee de formes de realisation p referees 
Lexigue 

Ressource (ou element): Ressource dMnformation telle qu'une page Web, une partie de page 
Web, un document, ou encore un element XML. Chaque ressource pent elle-m6me etre 
constittiee de ressources, formant ainsi une structure arborescente. 
35 Ressource courante : Ressource accedee par Tutilisateur au moment courant lors d'une navigation 
(c'est notamment la page Web visualisee dans la fenStre principale du navigateur). 
URI (Uniform Ressource Identifier): Adresse de ressource . Sera parfois utilise comme 
synonyme de URL (universal ressource locator). 
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Lien : URI place dans une ressource. En general, en cliquant sur un lien, rutilisateur peiit 
acc^der k la ressource point^e par lui. 

Citer (Une premiere ressource cite une deuxifeme ressource) : La premiere ressource possfede un 
lien vers la deuxi^me ressource. 

Populaire : Se dit d'une ressource qui est acc6d6e par un grand nombre d'utilisateurs (par 
exempie sur le Web) k partir de son URI. 

Ressource privee : Ressource qui n'est pas accessible par un grand nombre d'utlUsateurs 
(notamment qui n*est pas publi6e sur le Web ou qui n*est pas largement connu). 

Memorisation associative : Ajout d'un lien vers une premiere ressource, sur une deuxi^me 
ressource, afin de pouvoir retrouver la premiere ressource par le proced6 de recherche 
associative . 

Recherche associative : Afin de retrouver une premiere ressource, acc^der k une ressource 
pertinente par rapport k une deuxieme ressource sur laquelle un lien sur la premiere ressource a 
6t6 ajoute. 

Lien aiout6 : URI insere par Tutilisateur dans un ensemble de liens associes. 

Spot propose : Spot pr6sente par le systeme en priority car comportant les liens associes les plus 
pertinents par rapport au contexte courant. 

Spot : Un spot est compose: 

- d'un ensemble de liens, en general associes a une ressource de reference. Les ressources 
point^es par Jes liens associ6s sont accessibles (par exempie sur le Web) a partir de leur URI 
respectifs. Les liens associes sont composes de liens associds donnas et de liens assocife 
completes. 

- et (optionnellement) d'un ou plusieurs ensemble de lien(s) (en particulier liens ajoutes par le 
cr&teur du spot et liens ajoutes par des utilisateurs du spot), propos6(s) a I'utilisateur dans le 
cadre du proc^dd de recherche associative, 

- et (optionnellement) d'un lien vers ladite ressource de r^fiSrence, lesdits liens associes 6tmt 
selectionnes comme etant pertinents par rapport a cette ressource de r6f6rence, 

Domaine de pertinence d'un spot : Ensemble des ressources d6sign6es par les liens associes de ce 
spot. 

Liens associes donnes : Liens associes specifies explicitement (par celui qui cree ou qui publie la 
ressource k laquelle ledit ensemble est associ6, ou encore par celui qui cr6e un spot pour cette 
ressource). 

Liens associ6s completes : Liens associes determines automatiquement (notamment au moyen 
d'un algorithme de distillation relative decrit dans lapresente description). 

Score de lien associe : Score de pertinence par rapport a Tensemble des liens associes donnes. Ce 
score peut 8tre calculi par un algorithme de distillation relative tel que Tun de ceux d^crits dans 
lapresente description. 

Score autorite : Score de pertinence d'une ressource par rapport k un ensemble de liens associes 
donnes. 
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Score pivot : Score de pertinence d'un ressource citant d'autres ressources, repr^sentant la 
pertinence des ressources citdes par rapport a un ensemble de liens associds donnes. 

Score non-contextuel : Score de pertinence ne dependant pas du contexte. 

Score contextuel : Score de pertinence dependant du contexte. 

5 Spot non-contextuel par rapport a une ressource (ou a un ensemble de ressources) en question: 
Spot dont les liens associds comprennent I'URI de la ressource en question (ou au moins certains 
des URI des ressources en question) avec un score (ou une moyenne de scores) sup6rieur(e) i un 
seuil donn6 ou qui est selectionne de maniere h Je (ou la) maximiser (of. la mdthode de selection 
de spot ddcrite dans la pr6sente description). 

1 0 Spot contextuel : Spot dont les liens associes sont les plus pertinents part rapport au contexte. 
Contexte : Contexte de navigation. 

Spotserver : Serveur sur Tlntemet foumissant Tassociation entre lien associe et spot. 

Spotserver courant : Spotserver auquel Tutilisateur est directement connect^. 

Region pertinente d'une ressource : Partie d'une ressource contenant au moins un lien pertinent 
15 et ne contenant pas de lien non pertinent. 

Precedes de memorisation et de recherche associatives 
[Vocabulaire utilise : 

premiere page = page memoris6e par Tutilisateur afm quMl puisse la retrouver facilement ; 

20 deuxieme page = page utilisee par Tutilisateur comme support de memorisation (pour mdmoriser 
une association avec la premiere page, que Ton ddnommera dans la suite par « pour mdmoriser la 
premiere page » par souci de concision) ; 

page courante = page prdsentde au moment courant dans la fenStre principale du navigateur 
Internet. 

25 II s'agit par exemple de pages Web, toutefois la premiere page peut etre une ressource privee 
telle qu'un document (document texte, multimedia ou autre) qui lui appartient], 

Le systeme permet h Tutilisateur d^ajouter un lien vers une premifiire page sur n'importe quelle 
deuxieme page (ou au voisinage de la deuxieme page ; on utilisera dans la suite Texpression 
« sur la deuxifeme page » par souci de concision).^ 

30 L'utilisateur accede aux pages au moyen d'un navigateur dot€ de Textension propre au systdme 
(ou via un serveur Web intermediaire). Ajouter un lien peut se faire par exemple par un glisser- 
ddposer : Tutilisateur attrape une poignde repr&entant la premiere page et la depose sur la 
deuxieme page ; par exemple le lien ajoutd est alors prdsente par le systeme comme une vignette 
dans le style d'un « post-it » a Tendroit oil il a ete depose, ou dans une fenetre adjacente k la 

35 fenStre principale du navigateur (ou dans un cadre adjacent au cadre presentant la page Web 
d'origine). II peut aussi la d6poser sur une icdne repr^sentant la deuxieme page (par exemple 



^ L'dtape consistant k ajouter ainsi un lien, sur une deuxieme ressource, vers une premiere ressource (afin de pouvoir 
la retrouver par le proc^^ d^crit dans ce rapport) est appel^e memorisati on associative. 
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dans ses liens favoris). Le systfeme memorise alors la relation avec i'utilisateur 
consid6r6, 1' association entre le lien sur la premiere page et la deuxifeme page en question, 

Ensuite, quand I'utilisateur accede a une page pertinente par rapport a la deuxieme page (ou a la 
deuxieme page elle-meme), PURI^ de ce Hen aiout6 vers la premidre page lui est 
5 automatiquement pr6sent6. 

Ainsi, pour retrouver la premiere page, I'utilisateur n'a qu'a acc6der k une page quelconque^ qui 
soit pertinente par rapport a la deuxieme page. 

Plus simplement, dans la mesure oti : 

- Tutilisateur choisit ladite deuxieme page parce qu'elle est pertinente par rapport a la premiere 
10 page 

- et que la relation de pertinence est transitive a ce niveau, 

pour retrouver la premiere page, I'utilisateur n'a qu'a acceder a n'importe quelle page (accessible 
par le systeme) qui soit pertinente par rapport k la premiere page : c'est le proc6d6 de recherche 
associative . ^ 

15 Noter que lors de V&iopt de memorisation associative Tutilisateur pent augmenter ses chances en 
ajoutant un lien vers la premifere page sur plusieurs deuxifemes pages. 

Par ailleurs, dans la mesure ou les relations de pertinence sont symetriques, les liens ajoutes sont 
implicitement bidirectionnels. En outre, dans le cas ou la page courante est une ressource privee, 
le systfeme peut Passimiler k la (aux) deuxi6me(s) page(s) sur laquelle (sur lesquelles), le cas 
20 echfiant, I'utilisateur avait ajoute un lien vers cette ressource privee, et presenter les autres 
preini^res pages qu'il avait egalement ajout^es sur cette (ces) deuxieme(s) page(s). 

L'6tape de memorisation associative peut gtre automatis6e (ou etre assist^e par ordinateur). En 
effet, Tajout d'un lien vers une premiere page sur une deuxiSme page peut gtre (semi-) 
automatisde selon les Stapes suivantes : 

25 I - d^erminer des raots-cles ou des phrases principales de la premiere page (contenus dans la 
page ou associes a elle-par exemple delimites par des balises de type « meta-tag »), 

II - foumir ces mots-cles ou phrases principales a un moteur de recherche qui retoumera un 
ensemble de liens sur des pages contenant ces mots-cl^s, 

III - en prendre au moins un sous-ensemble (par exemple les N meilleurs selon le moteur de 
30 recherche) pour les utiliser comme deuxi^mes pages, 

IV - ajouter un lien vers la premiere page sur ces deuxifemes pages, 

Noter qu'en ce qui conceme P^tape I, diverses techniques d 'extraction automatique des mots- 
cl6s ou des phrases principales d'un texte existent d6}k. 



^ Ainsi qu'optionnellement d'autres indications concemant le lien ajout6, tel que le texte ou I'objet graphique qui 
accompagne le lien ajout6, ou encore une pr6sentation simplifi6e ou miniaturis^e de la premiere page elle-m6me. 
^ Ladite page quelconque est d^ja ou devra ^tre prise en compte par le systfeme. L*utilisateur pr6f6rera ainsi choisir 
une page populaire pour acc^l^rer la recherche. Le systfeme est muni d'un crawler dont le but est justement de 
prendre en compte le plus possible de pages accessibles (notamment sur I'Intemet) et qui int^ressent Putilisateur. 

^ Pour faciliter la lecture, on d^crit ici le proc^dd de memorisation/recherche associative en pariant de pages, mais 
proc6d6 s*applique plus largement k des ressources (pas seulement h des pages). 
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On peut 6galement extraire du texte les mots-cl^s, de la manidre suivante : 

- pour chaque mot, determiner le score de ce mot en additionnant les scores des phrases dans 
lesquelles il se trouve et ensuite normaliser ces scores (par exemple en divisant chaque score 
ainsi obtenu par la racine carr6 de la somme des carr6s de tous les scores ainsi obtenus) ; 

5 - s61ectionner les mots ayant les plus grands scores comme mots-cl6s. 

Les deux procedes present^s ci-dessus peuvent Stre combines en ne retenant des mots-cl6 
selectionn6s que ceux qui se trouvent dans les phrases s61ectionn6es. Le proc6d6 complet 
d'extraction des mots-cl6s du texte est alors comme suit : 

- dter du texte les mots non significatifs (appeles « stop words » dans la litt6rature) ; 

10 - identifier les liens entre les phrases : une phrase est li^e a une autre quand elle contient au 
moins un mot en commun ; 

- appliquer la methode de distillation absolue (d^crite plus loin), ou une methode equivalente 
exploitant un graphe de liens (telle que PageRank), sur les phrases ainsi liees entre elles, pour 
determiner leurs scores ; 

15 - pour chaque mot, determiner le score de ce mot en additionnant les scores des phrases dans 
lesquelles il se trouve et normaliser; 

- selectionner les phrases ayant les plus grands scores comme 6tant les phrases principales du 
texte. 

En variante, dans la mesure ou (une ou) certaines phrases du texte peuvent etre reper6es comme 
20 etant preponderantes, pour determiner les scores des phrases, au lieu de la methode de distillation 
absolue on peut utiliser la methode de distillation relative (decrite plus loin) pour determiner le 
score de pertinence des phrases par rapport auxdites phrases preponderantes. 

Par ailleurs, au lieu de phrases proprement dites, on peut considerer n'importe quelle sorte de 
parties ou unites de texte. Le procede utilisant la distillation relative consiste ainsi a determiner 
25 des scores de pertinence d* « unites de texte » (telles que des phrases) co-citees : 

On identifie les unites de texte comprenant au moins un mot en commun avec Tunite (ou 
Pensemble des unites) preponderante(s), pour former un groupe d'unites de texte citantes. On 
cree (temporairement) un lien apartir de chaque unite de texte citante vers Tunite (ou T ensemble 
des unites) de texte preponderante(s). 

30 On identifie les unites de texte contenant au moins un mot egalement contenu dans les unites de 
texte citantes, pour former un groupe d'unites de texte co-citees. On cree (temporairement) un 
lien Apartir de chaque unite citante vers chaque unite co-citee avec laquelle ladite unite citante 
possede au moins un mot en commun. 

On applique ensuite un des procedes de calcul de scores de pertinence par la methode de 
35 distillation relative decrits plus loin. L'ensemble des identifiants des unites de texte pertinentes 
constitue les URI de la requSte. ^ 

On va maintenant decrire la mise en oeuvre du systfeme de recherche associative. 



^ L'ensembie des identifiants des unit& de texte citantes constitue Tensemble K. L'ensemble des identifiants des 
unites de texte co-cit^es constitue Tensemble JT***, et ainsi de suite. 
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Pour pr&enter, A un utilisateur qui accede k une page courante, des liens sur des premieres pages, 
le systdme effectue les Stapes suivantes: 

Etape a : determiner le score de pertinence de deuxiemes pages candidates par rapport a la page 
courante, ^ 

5 Etape b : selectionner les (ou un certain nombre de) deuxiemes pages ayant (le cas ech^ant) un 
score de pertinence suffisant, 

Etape c. presenter a Tutilisateur les (URI des) premieres pages des liens quMl avait ajout6 sur les 
deuxiemes pages qui ont 6t6 s^lectionnees i I'^tape b; optionnellement lui presenter aussi les • 
(URI des) deuxiemes pages elles-m6mes7 

10 En variante, lors de la memorisation associative, au lieu d'ajouter sur la deuxifeme page un lien 
vers la premiere page, Tutilisateur peut superposer k la deuxieme page ou y insurer une 
annotation (ou n'importe quelle ressource telle qu'une icone ou autre objet graphique), qui joue 
alors Je rdle de premiere page au sens du present proc6de. Dans ce cas, lors T^tape (c) de la 
recherche associative, le systeme presente laou les deuxiemes pages qui ont et6 s^lectionnees en 

1 5 presentant aussi leurs annotations (ou la ressource qui teur a ^te ajout^e).* 

Pour faciliter la lecture, on va consid6rer les 7 ensembles (voir la figure Fig. 1) suivants: 

• R est constitue par les pages^ de la requete. 

• K est Tensemble des pages qui contiennent un lien vers^^ au moins une page de la 
requSte. 

20 • R'"^ est Tensemble des pages point^es (cit6es) par au moins une page de iT. 

• R'*' est Tensemble des pages qui citent au moins une page de R'^ ( R~ cz R'^ ). 

• est Tensemble des pages cit6es par au moins une page de la requete (R). 

• R^~ est Tensemble des pages qui citent au moins une page de R^. 

• R'^'^ est Tensemble des pages citees par au moins une page de R^' (R^ c: R^^ ). 
25 — 

Pour determiner le score de pertinence des deuxiemes pages candidates par rapport a une page 
courante R (entendre ici R comme ressource courante ' le systfeme met en oeuvre un procdd6 de 
« distillation relative » comprenant au moins Tune parmi les 6tapes a et a' suivantes. 

Etape a : 



Cette 6tape est composde de T^tape a et/ou I'6tape a' (voir plus loin. . .) 

Pour ce faire, comme d6jk mentionn6, le systeme poss^de en m^moire la relation entre utilisateur, deuxidme page 
<sur laquelle I'utilisateur en question a ajout6 des liens) et premiere page (Hen ajoutd par Tutilisateur en question sur 
la deuxieme page en question). Ainsi le systfeme peut tout d'abord determiner Tensemble des deuxiemes pages 
candidates pour Tutilisateur courant pour effectuer T^tape a, puis k I'dtape c retrouver les liens ajout^s h presenter k 
Tutilisateun 

* Dans le reste de la description, par lien ajout^ sur une deuxidme page on entend que Ton inclut ce cas de figure ou 

il y a une ressource ajout^e k la deuxieme page. 

' ^ar « page » on entend « URI de page ») 

*° (autrement dit « qui citent », ou encore « qui pointent ») 

' ' Car ici la requite est fonn^e d'une seule page. 
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Etape a-1 : Identifier rensemble R' des pages qui possSdent au moins un lien vers R ; 

Etape a-2 : Retrouver en m6moire rensemble des deuxifemes pages candidates pour I'utilisateur 
courant et effectuer T intersection entre rensemble R"^ des pages point6es par les pages de R' 
(noter que R est dans 1 'ensemble R'^) et rensemble des deuxifemes pages candidates pour 
5 rutilisateur courant ; 

Etape a-3 : Pour chaque page de Tensemble resultant de Tdtape a-2, calculer son score de 
pertinence fscore autorit6) par rapport a R. (Noter que cette etape inclut Tidentification de 
1' ensemble des pages de R'"^' possedant au moins un lien pointant vers au moins un sous- 
ensemble de rensemble resultant de r etape a-2 --voir la section « Selection des spots »). 

10 Etape a': 

Etape a'-l : Identifier rensemble R^ des pages point^es par R ; 

Etape a' -2 : Retrouver en m6moire rensemble des deuxidmes pages candidates pour J'utilisateur 
courant et effectuer r intersection entire rensemble R^' des pages possedant au moins un Jien vers 
une page de R* (noter que R est dans rensemble R^') et I'ensemble des deuxi^mes pages 
1 5 candidates pour r utilisateur courant ; 

Etape a'-3 : Pour chaque page de rensemble resultant de I'^tape a' -2, calculer son score de 
pertinence fscore .pivot) par rapport A R, (Noter que cette 6tape inclut r identification de 
rensemble des pages de R^"'^ point6es par au moins un sous-ensemble de 1' ensemble resultant de 
retape a'-2). 

20 Le calcul des scores de pertinence aux etapes a-3 et a'-3 peut s'effectuer au moyen notamment de 
rune des Equations presentees plus loin a la section « Selection des spots » qui decrit par ailleurs 
des ameliorations au precede present^ ci-dessus. Notamment les scores sont affines par iterations 
successives. Lors de ces iterations, les pages pivot dans I'etape a et les pages autorite dans I'etape 
a' acquidrent aussi des scores de pertinence (respeotivement scores pivot et scores autorit6). En 

25 plus des deuxi^mes pages candidates (c'est-a-dire en plus des URI des pages de R'^ dans retape 
a et/ou de R^' dans retape a') determinees comme decrit ci-dessus, on peut alors aussi inclure, 
dans rensemble resultant foumi a retape b, les pages pivot de retape a et les pages autorite de 
retape a' (puisqu'elles ont maintenant des scores de pertinence). Par ailleurs les poids des liens 
entre pages proches^^ sont amoindris pour ameiiorer les resultats davantage. 

30 Le systeme peut done seiectionner les deuxiemes pages les plus (ou suffisamment) pertinentes a 
i'etape b et effectuer retape c pour presenter a rutilisateur leurs liens ajoutes. 

Les resultats obtenus par le precede de distillation relative peuvent etre memorises (puis 
maintenus - voir plus loin la section « Maintenance des spots ») dans le but d*eviter de les 
recalculer lors des accfes aux pages courantes d6}k traitees. Ainsi, le systfeme maintient, dans une 
35 deuxieme memoire, les scores des deuxiemes pages par rapport aux pages courantes dans les cas 
ou ces scores sont superieurs a un seuil donne. Pour une page courante dcjk traitee, la reponse du 
systeme est alors quasi immediate. 

Autrement dit, retape a est modifiee comme suit : 



On peut utiliser un moteur de recherche sur le Web pour determiner les ressources qui pointent vers une ressource 
donn6e. 

Pour identifier la proximit^s des pages aux extrdmit^ des liens le systeme identifie en plus T ensemble des pages 
R*" des pages possedant au moins un lien vers les pages R" et Tensemble des pages R"*^ des pages possddant au 
moins un lien vers les pages R^ (voir la section « Filtrage »). 
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Etape a* : consulter la deuxidme m6moire pour savoir si les deuxiemes pages les plus peitinentes 
pour la page courante ont deja 6t6 memorisees (et si ces donn^es en memoire sent suffisamment 
fraiches), le cas ech^ant passer a J 'etape c, sinon determiner et memoriser le score de pertinence 
de deuxiemes pages candidates par rapport k la page courante. 

5 En variante, le systfeme memorise {puis maintient - voir plus loin la section « Maintenance des 
spots ») les donn6es n^cessaires sans attendre qu*un utilisateur accede k une page courante ; la 
memorisation est declench^e par rutilisation, par rutilisateur, d'une nouvelle deuxidme page 
(comme support de memorisation associative). 

En exploitant le fait que les scores de pertinence sont r6flexifs*^ le systSme part de chaque 
10 deuxieme page pour construire R' et i?"*" (et BT^^ et/ou et (et R^"^), calcule par distillation 
relative les scores de pertinence de toutes les pages courantes potentielles, et les memorise dans 
une deuxieme memoire (c'est une m6moire inverse apte k foumir, pour chaque page courante 
potentielle, les deuxiemes pages perdnentes). 

Par ailleurs, comme deja indiqu6, le systdme maiintient une premiere memoire contenant les liens 
1 5 ajoutSs par utilisateur et deuxierne page.*^ 

Ainsi, quand un utilisateur accede r^ellement k une page courante, le systeme selectionne dans la 
deuxieme m6moire les deuxiemes pages - parmi ies deuxiemes pages utilis^es par cet utilisateur 
comme support de memorisation^^ - qui ont les scores de pertinence ies plus eiev^s par rapport k 
ladite page courante, puis retrouve (dans la premiere memoire) les liens ajout^s par cet utilisateur 
20 sur ces deuxidmes pages. 

Autrement dit, le precede comprend ies etapes suivantes'^. 

Pour chaque nouvelle deuxifeme page R (sur laquelle un utilisateur ajoute un lien) 

Etape ml: Effectuer au moins Tune des Stapes ml-1 et ml-l', puis effectuer Petape ml-2 : 

Etape ml-1 : 

25 - identifier Tensemble R' des pages qui possfedent au moins un lien vers R ; 

- identifier Tensemble R"^ des pages courantes potentielles. pointees par les pages de R' ; 

- pour chaque page de R"^ (sauf R) calculer son score de pertinence Cscore autorite - voir la 
section « Selection des spots ») par rapport k R ; noter que cette etape inclut identification de 
Tensemble des pages iT*' possedant au moins un lien pointant sur au moins un sous-ensemble de 

30 R'^ (voir la section « Selection des spots »); 

Etape ml-r: 

- identifier Tensemble R^ des pages vers lesquelles R possede au moins un Hen; 



(i.e. le score de pertinence d'une deuxieme page par rapport a une page courante est ^gal au score de pertinence de 
cette page courante par rapport k cette deuxieme page) 

Noter que, avantageusement, Ies donn^es dans la deuxieme m€moire ne sont pas par utilisateur et peuvent ainsi 
servir h tous les utilisateurs. 

(celles-ci sont indiqu^es dans la premiere memoire) 

Les 6tapes ml et m2 d6crivent le proc6d6 de memorisation associative, Ies Stapes a, b et c d^crivent le proc^d^ de 
recherche associative. 

**L'6tape ml est effectu^e seulement pour les nouvelles deuxiemes pages, tandis que I'dtape m2 est effectu6e 
chaque fois qu'une deuxieme pages utiHs6e par un utilisateur, qu*e!les soit nouvelle pour le systeme ou pas. 
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- identifier Tensemble R^' des pages courantes potentielles pointant vers au moins une page de 

- pour chaque page de R^' (sauf R) calculer son score de pertinence (score pivot - voir la section 
« Selection des spots ») par rapport a R ; noter que cette etape inclut T identification de 

5 rensemble des pages R^"^ point6es par au moins un sous-ensemble des elements de K^' ; 

Etape ml-2 : m6moriser, dans une deuxieme m^moire, les URJ des pages ayant un score de 
pertinence suffisant par rapport a R, en relation avec R, de manidre k ce qu'k partir de TURI de 
chacune desdites pages ayant un score de pertinence suffisant par rapport k R on puisse 
retrouver^^ (la deuxieme page) R ainsi que ledit score de pertinence suffisant; 

10 Etape m2 : (en parallele avec I'etape ml) m^moriser dans une premiere memoire, pour chaque 
utilisateur et chaque deuxidme page, les liens ajout^s que ledit utilisateur a ajout6 sur ladite 
deuxieme page ; 

Lors de Tacces a une page courante par un utilisateur : 

(L'6tape a n'est plus n^cessaire puisque les scores sont dej^ en mSmoire). 

15 Etape b-m : S61ectionner dans la deuxifeme memoire un certain nombre de deuxiemes pages^^, 
parmi les deuxiemes pages utilisees par ledit utilisateur (indiques dans la premiere memoire), 
pour lesqueiles les scores de pertinence de ladite page courante sont les plus Aleves (s'ils 
existent); 

Etape c {inchang6e) : Retrouver dans la premiere memoire les liens ajoutes par ledit utilisateur 
20 sur les deuxiemes pages selectionnees a I'etape b-m et les presenter audit utilisateur (avec 
optionnellement les deuxieme pages sur lesqueiles ils ont ete ajoutes et de maniere tri6e). 

On appliquera egalement les ameliorations presentees plus loin a la section « Selection des 
spots ». Notamment comme les scores sont affines par iterations successives, les pages pivot 
dans I'etape ml-1 et les pages autorit^ dans I'etape ml-l" acquierent aussi des scores de 
25 pertinence (respectivement scores pivot et scores autorit6) et peuvent ainsi dire inclus dans 
rensemble resultant fourni k I'etape ml-2 (en plus des URI des pages de R^'^ dans T^tape ml-1 
et/ou de R'^' dans I'etape ml-l'). Par ailleurs, ici aussi les poids des Hens entre pages proches 
sont amoindris pour ameliorer les r^sultats (voir la section « Filtrage »). 

Avec ce dernier precede, les liens ajoutes sont pr^sentfe quasi imm^diatement par le systdme 
30 dans tous les cas, c'est-i-dire mgme quand une page courante est acc6d6e par un utilisateur pom- 
la premiere fois. 

On avait mentionn^ que lors de T^tape de memorisation associative 1' utilisateur peut augmenter 
ses chances en ajoutant un lien vers la premiere page sur plusieurs deuxiemes pages. On va 
maintenant lui permettre de former des groupes de deuxiemes pages auxquelles est ajoute un lien 
35 vers la premiere page (I'id^e etant que, comme la premiere page peut Stre int^ressante par rapport 
a plus d'un centre d'intdret de I'utilisateur, les groupes permettent de classer la premiere page par 
rapport h des centres d'int6rdt distincts, chaque groupe correspondant k un centre d'interet 
different). 



(ainsi que les autres deuxiemes pages, le cas 6ch6ant, pour lesqueiles le score de pertinence de R est suffisant) 
^° Normalement, dans la deuxieme memoire, les URI des deuxiemes pages pertinentes par rapport k une page 
courante potentielle sont d^j& tri^s par score de pertinence. 
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Concretement, chaque fois que I'utilisateur ajoute un lien (vers la premiere page) sxir -une 
nouvelle deuxi^sme page, le ou les groupes de deuxiemes pages qu'il avail deja formes le cas 
^cheant pour la premiere page lui sont proposes par le systfeme et il peut alors choisir un ou 
piusieurs de ces groupes dans lesquels insurer ladite nouvelle deuxieme page, ou sinon il peut 
5 cr6er un nouveau groupe form^ de la seule nouvelle deuxifeme page. 

II peut aussi par la meme occasion manipuler ses groupes plus largement, comme par exemple 
supprimer une deuxieme page d'un groupe, scinder un groupe en deux, fusionner deux groupes, 
supprimer un groupe, etc. Enfin, il peut aussi dupliquer un groupe pour y ajouter un lien sur une 
autre premiSre page. 

10 Chaque groupe est traits par le systfeme comme une requSte de distillation relative. De mani^re 
similaire au dernier proc6d6 decrit^\ pour chaque requete R (c'est-a-dire pour chaque groupe de 
deuxiemes pages) le systeme identifie et memorise (puis maintient - voir plus loin la section 
« Maintenance des spots ») les pages courantes potentielles qui ont un score de pertinence 
suffisant, et forme ainsi une memoire inverse apte h foumir, pour chaque page courante 

15 potentielie, les requetes les plus pertinentes (c'est-a^dire les groupes les plus pertinents). 

Autrement dit, la memorisation associative comprend les Stapes suivantes : 

(L'etape ml est effectuee seulement pour les requStes non dej^ connus par le systeme ou pas 
suffisamment fraiches, tandis que l'etape m2 est effectuee pour toutes les requStes des 
utilisateurs, qu'elles soient nouvelles pour le systeme ou pas). 

20 Etape ml: Eflfectuer au moins i'une des 6tapes ml-1 et ml-r, puis effectuer T^tape ml-2 : 

Etapeml-1 : 

- identifier Tensemble R' des pages qui possSdent au moins un lien vers une page de R ; 

- identifier T ensemble R'^ des pages (vues comnie pages courantes potentielles) point^es par au 
moins une page de K ; 

25 - pour chaque page de R'^ (sauf R) calculer son score de pertinence fscore autorite - voir la 
section « Selection des spots ») par rapport a R ; noter que cette etape inclut T identification de 
Tensemble des pages R"^' poss^dant au moins un lien pointant sur au moins un sous-ensemble de 
R"* (voir la section « Selection des spots »); 

Etape ml-r: 

30 - identifier Tensemble R^ des pages vers lesquelles au moins une page de R possdde un lien; 

" identifier Tensemble R^' des pages courantes potentielles pointant vers au moins une page de 
R^ 

- pour chaque page de R^^ (smfR) calculer son score de pertinence (score pivot) par rapport a R ; 
noter que cette etape inclut 1' identification de I'ensemble des pages R"*"'^ pointees par au moins un 

35 sous-ensemble de R^' ; 

Etape ml-2 : m^moriser, dans une deuxieme memoire, les URI des pages ayant un score de 
pertinence suffisant par rapport A R, en relation avec R, de manidre k ce qu'^ partir de I'URI de 



La diff<5rence est qu'ici R represente une requete form^e d'une ou piusieurs ressources alors qu*avant R 
repr^sentait une seule ressource (une seule deuxi^e page). 
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chacune desdites pages ayant un score de pertinence suffisant par rapport k R on puisse 
retrouver^ R ainsi que ledit score de pertinence suffisant; 

Etape m2 : (en parall^le avec I'^tape ml) m^moriser dans une premiere m^moire, pour chaque 
utilisateur et requete, les liens ajout^s (vers premieres pages) ; 

5 Lors de racces h une page courante par un utilisateur : 

Etape b-m : Selectionner dans la deuxieme m^moire un certain nombre de requStes, parmi les 
requStes (groupes) utilis^es par ledit utilisateur comme support de memorisation associative 
(indiqu^s dans la premiere memoire), pour lesquelles les scores de pertinence de ladite page 
courante sont les plus Aleves (s'ils existent); 

Etape c : Retrouver dans la premiere memoire les liens ajoutes par ledit utilisateur sur les 
requetes selectionnees a I'^tape b-m et les presenter audit utilisateur, avec optionnellement : 

- les (ou un certain nombre des) requetes sur lesquelles ils ont 6t6 ajoutes, 

- ainsi qu'un certain nombre de (liens vers des) pages pertinentes ayant un score de pertinence 
estim^ (k Teta^pe ml-2) suffisant par rapport auxdites r^quStes selectionnees k T^tape b-m?^ 

On E^pliquera egalement les ameliorations presentees plus loin a la section « Selection des 
spots ». Notamment comme les scores sont affmes par iterations successives, les pages pivot 
dans I'etape ml-1 et les pages autoritd dans i'etape ml-T acquierent aussi des scores de 
pertinence (respectivement scores pivot et scores airtorite) et peuvent ainsi etre inclus dans 
I'ensemble resultant foumi a I'etape ml-2 (en plus des URI des pages de dans Tetape ml-1 
et/ou de R"**' dans i'etape ml-T). Par ailleurs les poids des liens entre pages proches sont ici .aussi 
amoindris pour ameliorer les r^sultats (voir la section « Filtrage »). 

A I'etape b-m, le systeme fournit un ensemble de requetes selectionnees. II serait avantageux 
d'affiner ia selection de mani^rc^ presenter a Putilisateur (la ou) les requfites^^ qui soient les plus 
pertinentes par rapport au contexte de navigation de Tutilisateur. C*est ce que Ton va maintenant 
25 decrire. 

L'histoire de la navigation d'un utilisateur est modelis^e k I'aide d'une « pile de contexte », ou a 
chaque lien (pouvant etre presents k 1' utilisateur) est associ^ un score de pertinence k chaque 
niveau de navigation, et quand un lien est inexistant on Tassimile a un lien dont le score est 6gal 
a z6ro. 

Quand I'utilisateur clique sur un lien et accede a une nouvelle page, le systfeme ajoute un niveau 
a la pile de contexte. En revanche, quand il clique sur la commande « Back » de son navigateur 
le systdme d^pile un niveau. 

Pour un lien donne, le score contextuel est une moyenne des scores non contextuels^^ k chaque 
niveau de la pile de contexte, ponderes en fonction de la profondeur. Afm de ne pas avoir k 
recalculer tous les scores a chaque fois, on utilise une ponderation exponentielle, ce qui fait que 



(panni Pensemble des requdtes memoris6es, le cas ^ch^ant, pour cette page) 

Ces URI sont analogues aux « related Hnlcs » mentionn^s k la section « L^^tat de la technique », cependant ils sont 
plus pertinents car leurs scores de pertinence ont 6t6 calculus par rapport k la requSte k laquelle ils sont associ^ par 
distillation relative. 

(avec les premieres pages et les liens pertinents correspondants) 
^ (c'est-i-dire d^termin^s en ne tenant pas compte du contexte) 
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le score contextuel k un certain niveau est la moyenne pond6r6e du score non contextuel a ce 
niveau et du score contextuel au niveau precedent 

Autrement dit, pour un URI donne, s 6tant le score non contextuel au dernier niveau et r le score 
contextuel au niveau precedent, le score contextuel au dernier niveau est : lambda.r + (1 — 
5 lambda)-s (lambda 6tant une pond6ration constante entre 0 et 1, en principe infSrieure a Vz : plus 
lambda est grand, plus le pass6 a d' importance). 

Parmi les requetes (c'est-a-dire les groupes) s^lectionnees h Tetape b-m, le systfeme s^lectionne 
celles qui sont les plus proches du contexte, c'est-a-dire celles pour lesquelles les scores des URI 
memorises h Tetape ml -2 sont les plus proches des scores contextuels pour Tutilisateur en 
10 question. Pour determiner la proximite de chaque requite avec le contexte, le systdme calcule la 
somme des produits, pour chaque URI de la requdte, du score (non-contextuel) de la requete avec 
le score contextuel pour I'utilisateur en question. 

L'etape b-m est ainsi remplacee par Tetape b'-m suivante : 

Etape b'-m : S^Iectionner dans la deuxifeme memoire un certain nombre de requetes, parmi les 
. 15 requgtes (groupes) utilisdes par ledit utilisateur comrae support de memorisation associative 
(indiqu^s dans la premiere memoire), pour lesquelles les scores de pertinence de ladite page 
courante sont les plus 6lcv6s (s'ils existent) et pour lesquels les scores de pertinence des pages 
courantes potentielles sont les plus proches des scores de pertinence contextuels. 

On va maintenant d^crire un proc6de, exploitant le systdme des cookies, pour reconnattre 
20 rutilisateur quand il passe d'un site a l*autre, de maniere k pouvoir maintenir sa pile de contexte. 

Rappelons que le systeme des cookies permet aux serveurs de sites d'un domaine Internet (i.e. 
nom de domaine ou adresse IP) de reconnaitre un utilisateur (c'est-a-dire son ordinateur) quand il 
accMe a des pages Web appartenant a un meme domaine Internet. 

Le procede que Ton decrit ici permet a un serveur, qui met en CKUvre notre proc6d6 - on 
25 Tappellera serveur client (CLI) ~ de reconnaitre mSme les utilisateurs qui naviguent d'un site k 
Fautre qui ne font pas partie d'un m6me domaine Internet, mSme d'ailleurs si dans leur 
navigation ces utilisateurs passent par des sites qui ne mettent pas en oeuvre notre proced6. 

Pour ce faire, trois m6canismes de communication sont utilises : 

1- Chaque page Web d'un site d'un serveur client contient un cadre (frame) dont I'adresse est 
30 celui d'un serveur centralise (URS) qui gere notre proc^d^ de reconnaissance de Putilisateur 

(USER) ; 

2- Le serveur centralist et chaque serveur client ont chacun un cookie memorise dans 
I'ordinateur de Tutilisateur (noter que le temps de creation de ces cookies peut 6tre utilise pour 
estimer la fiabilite de reconnaissance de I'utilisateur) ; 

35 3- Le serveur client communique avec le serveur centralise directement. 

II y a trois cas possibles qui sont ddcrits ci apres (voir figure 2). 

Nouvel utilisateur pour le serveur client et pour le serveur centralist : 

L L'utilisateur (I'ordinateur USER) ouvre une page du site client (serveur CLI) ; il n*y a pas 
de cookie CLI. 

40 2. CLI demande k URS un identifiant libre pour USER et re9oit ID= "123456" 
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CLI renvoie k USER une page comprenant deux cadres 

Le premier cadre est k Tadresse http:/AJRS.coni/...?ID= "123456' 
Le deuxidme cadre est a Padresse http://CLLcom/.,. 



4. USER envoie k URS la requSte ht^ pour demander le contenu du premier cadre 
5 <http://URS.com/...?ID= "123456") ; comme il n'y a pas de cookie appartenant k URS, URS 

conclut qu'il s'agit d'un nouvel utilisateur et lui attribue I'identifiant "123456". 

5, URS r^pond et instalie un cookie (contenant ID= "123456") chez USER 

'6. (en parallele avec 5.) URS transmet [ID="123456" (pas de remplacement)] a CLI 

7, (en parallele avec 4.) USER envoie a CLI la requfete http pour demander le contenu du 
i 0 deuxieme cadre 

8. (apres reception de Tidentifiant au point 6) CLI envoie a USER le contenu du cadre 
.http://CLI.com/... 

Nouvel utilisateur pour le serveur client mais pas pour le serveur centralist : 
1 . USER ouvre une page du site client (serveur CLI) ; il n'y a pas de cookie CLI. 
i 5 2. CLI demande k URS un identifiant llbre pour USER et re9oit ID= " 123456" 
3. CLI renvoie k USER une page comprenant deux cadres 
• Le premier cadre est k Tadresse http://URSxom/...?ID= "123456" 



4. USER envoie k URS la requSte http pour demander le contenu du premier cadre 
20 (http://URS.com/.. .?ID= "123456) ainsi que le contenu du cookie (cr6e lors d'un acces precedent 

et comportant I'identifiant ID="ABCDEF") 

5. URS r6pond 

6. (en parallele avec 5.) URS transmet [ID="ABCDEF" rempla9ant ID=" 123456"] a CLI 
<+optionnellement des donnfes suppl^mentaires propres a ID="ABCDEF") 

25 7. (en parallele avec 4.) USER envoie k CLI la requfite http pour demander le contenu du 
deuxldme cadre 

8. (apres reception de ridentifiant "ABCDEF" au point 6.) CLI envoie a USER le contenu 
du cadre http://CLI.com/... ainsi qu'un nouveau cookie comportant ID="ABCDEF" en 
remplacement du precedent 

30 Utilisateur deja connu du serveur centralise et du serveur client : 

L USER ouvre une page du site client (serveur CLI)et transmet le contenu du cookie 
associ^ k CLI (ID="ABCDEF") 

2. (cette 6tape n' est pas applicable) 

3. CLI renvoie k USER une page comprenant deux cadres 

35 • Le premier cadre est k Tadresse http://URS.com/.. .?ID= "ABCDEF" 

• Le deuxidme cadre est k Tadresse http://CLLcom/... 



Le deuxidme cadre est k Tadresse http;//CLI.com/.,. 
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4. USER envoie k URS la requ6te http (http://URS.com/,..?ID= "ABCDEF", pour 
demander le contenu du premier cadre) ainsi que le contenu du cookie (cv66 lors d'un acc^ 
precedent et comportant aussi ID="ABCDEF") 

5. URS rdpond 

5 6. (Optionnellement, CLI peut demander et/ou recevoir de URS des donn^es 
supplementaires pour ID="ABCDEF") 

7. (en paraJlSle avec 4.) USER envoie k CLI la requSte http pour demander le contenu du 
deuxi^me cadre 

8. CLI envoie a USER le contenu du cadre http://CLLcom/,.. (le cas 6ch^ant aprds reception 
10 des donnees a I'^tape 6.) 

Le proc6d6 decrit ci-dessus permet de selectionner les liens a afficher dans les pages Web en 
fonction du contexte de navigation^^. C'est ce qu'on va maintenant d^crire. 

Partons de la situation ou chaque requete (le serveur qui Ph^berge) possede un ensenible d'URI 
initiaux ainsi que I'^nsemble des liens qui pourraient etre proposes A rutilisatexir avec leurs 
15 scores par defaut : les scores non contextuels. 

Comme ddja decrit, le score contextuel est une moyenne des scores non contextuels a chaque 
niveau de la pile de contexte, pond^res en fonction de la profondeur. Ainsi, r,- 6tant le score non 
contextuel au dernier nivisau et ?j le score contextuel au niveau pr6c6dent, sa valeur apres avoir 

suivi un lien est : H> + Ar^ 
20 Les liens present^s k Tutilisateur sont ceux qui ont le plus grand score contextuel. 

La pile de contexte peut Stre affichee dans le cadre URS (le premier cadre) introduit plus haut. 
Ainsi I'utilisateur peut voir quelles sont les pages qui sont intervenues dans le calcul des pages k 
afficher, 11 peut cliquer des elements de la pile pour remonter des niveaux, et un bouton « Erase » 
permet de vider la pile de contexte. 

25 La pile de contexte est stock^e, pour chaque utilisateur, dans le serveur centralist (URS), avec 
Tidentifiant de Tiitilisateur. Ainsi, chaque fois qu'un utilisateur ouvre une page chez un serveur 
client (CLI), celui-ci, ayant obtenu Tidentifiant de Tutilisateur, va donner a URS les scores non 
contextuels^^, lequel repondra avec les scores contextuel apr6s avoir effectue la moyenne 
ponddrde d&rite plus haut^^. Le serveur du site client pouira alors afficher dans la page les liens 

30 qui ont le meilleur score. 

Les etapes sont ainsi les suivantes (voir figure 3): 

1 . L'utilisateur (USER) envoie une requete ht^ pour ouvrir une page 



(ou, comme d^rit plus haut, de s61ectionner les requ8tes elles-m^mes ; ceci ^tant frivial on ne le decrit pas k 
nouveau) 

^ Ce qui donne = >l ^ ^"^i,n + ^'''/.rf ^^ec d la profondeur de la racine et ri;„ le score de la page Pi k la 
profondeur n. 

Pour ^viter du trafic inutile on peut selectionner les pages i envoyer en ne prenant que celles qui ont un score 
sup^rieur k un certain seuil, par exemple !a moiti^ du seuil exig^ pour qu'une page soit affichee k I'utilisateur 
Ceci s'efFectue dans le cadre de P^tape 6 decrit plus haut. 
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2. Le serveiff client (CLI) transmet au serveur centralist (URS) les scores non contextuels 
de la page en question et ridentifiant de I'ntiiisateur 

3. URS ajoute un niveau au contexte et calcule les scores contextuels 

4. Les scores contextuels <du moins les meilleurs d'entre eux) sont retoumts au serveur 
5 client 

5. Le serveur client selectionne ies liens qui ont le meilleur score et les prtsente h 
I'utilisateur. 

II peut 6tre int6ressant d'une part de grouper les liens dans diff6rentes parties des pages, voire 
m6me de hi6rarchiser les parties, c'est-a-dire de permettre h des parties de contenir des sous- 
10 parties, en plus de liens. Voici les changements que ceia implique ; 

• Le contexte courant^° doit contenir des informations de contexte pour chaque partie de la 
page affichte, done lorsque la page envoie ses scores non contextuels, elle en envoie autant qu'il 
y a de parties, et URS lui rtpond avec un contexte pour chaque partie. Pour 6viter certains 
probl^mes (voir points suivants) i\ faut :6galement un contexte par dtfaut, qui reprtsente la page 

1 5 elle-meme et ses parties et qui cumule tous les scores de tous les liens 

• Lorsque I'utilisateur clique sur un lien, il faut que le contexte de la partie qui contient ce 
lien soit utilis6 -comme contexte de dernier niveau (i.e. ce contexte-li sera utilise pour le calcul 
des scores aux niveaux suivants). Un moyen d'obtenir ce rfeultat est de mettre dans les adresses 
des liens un argument qui contient un identifiant (unique pour la page) de la partie, identifiant qui 

20 est egalement transmis k URS avec les scores non-contextuels. 

• Dans la mise en ceuvre du proctdt dtcrit ioi, i! faut faire attention k ne pas confondre les 
parties de difftrentes pag6s, par exemple si I'utilisateur a ouvert plusieurs fenStres de son 
navigateur et clique dans une fenStre apres avoir clique dans une autre (URS ne stocke qu'une 
pile de contexte). Ceci peut se faire en comparant le champ HTTP Referer avec I'adresse du 

25 dernier niveau de la pile et ne tenir compte du numtro de partie qu'en cas d'egalite. Dans les 
autres cas (Egalement si I'utilisateur est pass6 par une page d'un site non client) on prend le 
contexte par dtfaut. 

Un exemple plus complet (voir figures 4 et 5) : 

Voici done ce qui se passe lorsque I'utilisateur, d6ja dans un contexte particulier (pour la page 
30 cl com/main.html), clique sur un lien http://CLLcom/index.html?partie=l. (partie=l sigmfie que 
I'utilisateur a clique dans la partie 1). On suppose que le serveur client CLI ne connaK pas encore 
rutilisateur : 

(1) Le navigateur (USER) envoie la requSte http://CLLcom/index.html?partie=l au serveur 
du site client (CLI) en lui donnant en plus le Referer http://cl.com/main.html (I'adresse de ce 

35 cadre). 

(2) CLI va demander k URS un num6ro libre (il lui r6pond avec 12345) pour cet utilisateur 

(3) CLI i^pond k (1) avec une page comprenant deux cadres dont les adresses sont 
hit pT/AJRS.com/default.html?newId=12345 et http://CXI.com/main.html respectivement. II lui 
donne de plus un cookie temporaire (de session) newId-12345. 



C*est-i-dire I'ensMnble des scores contextuels des liens au niveau courant. 
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(4) L'utilisateur etant connu de URS, il a un cookie avec son vrai identifiant (678910). En 
chargeant les cadres, il (son navigateur) va envoyer une requete pour la page 
fattp://URS.com/default.html?newId^]2345 avec le cookie ID=678910. 

(5) L'utilisateur envoie egalement une requete pour la page http://CLJ.com/niain.html avec 
5 le cookie de session newld= 1 2345 . 

(6) Ayant re9u (5), le client CLI envoie h URS son adresse fhttp://CLLcom/main.html\ ses 
scores non contextuels, pour chaque partie de la nouvelle page, ridentifiant newID==12345, ainsi 
que le numero de partie (partie=l) qu'ii avait re9u au message (1), 

(7) Quand il a re9U (4) et (6), URS regarde le contexte de rutilisateur pour la partie 1, 
10 v^rifie que la page source fhttp://CLLcom/main.html) correspond au dernier niveau de la pile de 

contexte pour cet utilisateur (sinon il aurait ignor6 le num6ro de partie et pris la partie par d^faut 
"D"). Ensuite il calcule, pour chaque partie de la nouvelle page les nouveaux scores contextuels. 

(8) URS, ayant refu le message (6), peut r^pondre au message (4) de l'utilisateur (lui 
presentant la nouvelle pile de contexte et le bouton <ERASE>). 

15 (9) URS repond 6galement au message (6) de CLI en lui envoyant le vrai identifiant de 
Tutilisateur (678910), ainsi que les scores contextuels. 

(10) CLI peut maintenant rdpondre au message (1), en donnant k Tutilisateur sont vrai 
identifiant (cookie permanent ID=678910, pour le site CLLcom), ainsi que la page personnaiis^e. 

La notion d'utilisateur peut en reality englober plusieurs utilisateurs qui partagent des liens 
20 ajoutes (et les groupes qui leurs servent de support). Bien entendu^ une organisation plus fine des 
utilisateurs selon les liens ajoutfe qu'ils partagent est possible. 

On va maintenant d^crire le cas oti un utilisateur final s'abonne chez un utilisateur foumisseur 
afin que, selon le contexte, le systeme propose h T utilisateur final les groupes et premieres pages 
(au sens des groupes et premieres pages decrites jusqu'ici) crees par Tutilisateur foumisseur. Les 
25 premiferes pages peuvent notamment etre des publicites qui (grace aux capacit6s du systeme que 
I'on a jusquMci) sont automatiquement seiectionn6s par rapport au contexte. 

Les groupes cr66s par Tutilisateur foumisseur et proposes par le systeme h Putilisateur final sont 
appel6s « spot ». 

L'utilisateur foumisseur manipule et exploite les spots comme on I'a decrit jusqu*ici pour les 
30 groupes de deuxiemes pages. 

L'utilisateur final peut utiliser un spot comme support de memorisation en en faisant une version 
personnelle et en y ajoutant un lien vers une premiere page (ceci est d6crit plus loin). 

L'avantage principal de cette approche est de donner la possibility de cr6er de nouveaux spots (et 
les coflteux calculs de scores qu'ils impliquent) h certains utilisateurs seulement (ce sont les 
35 utilisateurs foumisseurs) et d'offrir la fonction de memorisation/recherche associative par 
IMnterm^diaire de spots pr6existants (qui n'est pas coOteuse en ressources machines) a tous les 
utilisateurs. 

Spot 

10 Le systeme que nous allons maintenant decrire foumit des liens pertinents (« related links », voir 
plus haut la section « L'6tat de la technique »). Toutefois, plutdt que de rechercher des liens 
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pertinents directement, notre systdme recherche d'abord sMl existe un spot -ou ressource de 
reference- dont les liens associ^s sont suffisamment proches de la ressource courante ou du 
contexte de navigation de I'utilisateur. Si c'est le cas, le syst^me retoume le (ou les) spot(s) dont 
les liens associ&s sont les plus proches, ainsi que ses liens iassocife offerts en guise de liens 
5 pertinents. 

Typiquement le spot est propose dans une fenetre adjacente a la fenStre principale du navigateur, 
comme Jes systemes existants foumissant des « related links », cependant contrairement a ces 
systfemes existants 

- le systeme de ['invention pr^sente des liens pertinents determines selon un procede de 
1 0 distillation relative (d6taill6 plus loin), 

- le contexte de navigation pris en compte par notre systdme n*est pas forc^ment uniquement la 
page courante, mais pent inclure Tensenible des ressources acc^dees recemment par I'utilisateur 
(en utilisant le systeme) et qui sont pertinentes par rapport k la ressource courante 

- les spots servent de m6moire associative pour les utilisateurs fournisseurs ; en effet, quand un 
15 spot est pr^sente k un utilisateur final, les liens vers premieres pages (ou autres ressources 

ajoutees^ , comme d^crit precedemment) ajout6s par rutilisateur foumisseur qui 2i cr€6 le spot 
sont presentes audit utilisateur fmal^^, 

- les spots servent de m^moire associative pour les utilisateurs finaux ; en effet, quand 
rutilisateur final ajoute un lien vers une premiere page sur une deuxieme page (comme on Ta 

20 decrit jusquMci), en r^ailite il ajoute un lien sur sa version personnelle du spot propose pour cette 
deuxieme page ou pour le contexte courant. 

En outre, presenter a I'utilisateur final des liens pertinents par rintermediaire de spots offre des • 
avantages en soi, tel que Tincitation a cliquer pour accdder a la ressource de reference (c'est-a- 
dire la page pr&entant le spot). 

25 Examinons maintenant quelques scenarios typiques de memorisation/recherche associative 
mettant en ceuvre les spots. 

Premier scenario d'utilisation : 

L'utilisateur fournisseur cree une nouvelle ressource ou choisit une ressource existante (par 
exemple une page Web i laquelle il vient d'acceder, ou un Element particulier contenu dans une 
30 page. . .) pour en faire la ressource de reference d'un nouveau spot 

Pour ce faire, il lui attribue au moins un lien associe donn^ pointant sur une page populaire. 

Le systeme complete Tensemble des liens associ6s^^ (comme d^crit k la section « S61ectionner 
des spots »). 

Ainsi, dans le fiitur, chaque fois qu'un utilisateur final va acc^der k une ressource point^e par 
35 Tun des liens associ^s k ce spot, ce spot pourra^^ lui etre propose. 



Voir plus haut la description du proc^d^ de selection de groupes de deuxi^mes pages (ici de spots) selon le 
contexte de navigation de I'utilisateur. 

Celles-ci incluent notamment des publicitds pour le compte d'annonceurs. Avantageusement, ces publicity sont 
pertinentes par rapport au contexte (en tout cas les spots qui leurs servent de support le sont). 

(ce dernier pouvant d'ailleurs etre ledit utilisateur foumisseur qui a cr^6 le spot) 

C'est r^quivalent de la deuxieme m^moire d^rite k la section prdc^ente. 
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Et, comme on le d^crit dans les deux scenarios d'utilisation suivants, des utilisateurs finaux 
pourront alors utiliser ce nouveau spot en tant que support de memorisation (de maniere analogue 
h rutilisation d'une deuxidme page ou d'un groupe de deuxiemes pages d^crits plus haut). 

Le cr^ateur de ce spot a ainsi I*avantage non seulement de s'en servir pour lui-mSme mais aussi 
5 de le voir propose h des utilisateurs finaux. Comme un lien sur la ressource de r^fSrence (incitant 
Putilisateur a cliquer) est inclus dans la presentation du spot, la ressource de reference est ainsi 
promue auprds des utilisateurs finaux. En plus, ses liens ajout^s (telles que des publicit6s) sur ce 
spot seront presentds aux utilisateurs finaux. 

Deuxieme scenario d 'utilisation : 

10 Sur le Web I'utilisateur final «tombe» sur une premiere page (ou autre type de ressource) 
tenement int6ressante quMl voudrait la m^moriser afin de pouvoir la retrouver facilement et 
retomber dessus spontanement quand il accede a des ressources pertinentes par rapport a elle. 

Supposons qu'aucun spot n'est spontanement propose par le systeme pour cette page.*^^ 

L'utilisateur visite une (au moins une) deuxifeme page, qui soit pertinente par rapport A la 
15 premiere, 

et pour laquelle il sait qu'un spot est propose, 

ou sinon il choisit une page Web qui soit populaire car il est ainsi plus probable qu*un 
spot soit propose pour elle, 

et sur le spot qui est propose pour cette deuxieme page il ajoute un lien vers cette premiere page 

20 (par exemple en seiectionnant un objet graphique representant la premiere page et en en 
effectuant un glisser-deposer sur la deuxieme page, comme decrit au debut de Ja description). 

Dans le futur, ce lien ajoute lui sera alors spontanement presente chaque fois que ce meme spot, 
ou qu'un spot proche, lui sera propose pour le contexte courant de sa navigation. 

Troisieme scenario (('utilisation : 

25 L'utilisateur final veut memoriser une ressource privee (tel qu'un document qui lui appartient et 
qui n'est pas publi6 sur le Web). La ressource privee joue ici le r61e de premiere page. 

II accede k une (deuxieme) page qui est pertinente par rapport k sa ressource privee (et qui de 
preference est populaire, ou pour laquelle il sait qu'un spot est propose) et il lui ajoute un lien 
vers sa ressource privee (c'est-a-dire qu'il insere ce lien dans sa version personnelle du spot 
30 propose pour cette deuxidme page). 



Ce ne sera pas forcement ce spot qui sera propose mais plutdt, partni tous les spots dont des liens associes pointent 
vers des ressources formant le contexte courant, le spot dans lequel ces lien associ^ ont les scores de pertinence les 
plus ^lev^s (ou les spots dans lesquels ces lien associ^ ont les scores de pertinence les plus ^levSs). La selection du 
(ou des) spot est d6crite k la section « S^Iectionner un spot ». 

Dans le cas contraire, sur (sa version personnelle de) ce spot, Tutilisateur va directement ajouter un lien vers cette 
premiere page Web. Mais noter cette action n*est pas strictement n^cessaire. En effet, d6ji sans rien faire 
I'utilisateur pourra retrouver cette premiere page en visitant une page proche et quelque peu populaire (en tant que 
lien pertinent associ6 ^ ce m§me spot ou i un spot voisin). Toutefois, en faisant cette action Tutilisateur a Tavantage 
suppl^mentaire de pouvoir la retrouver en tant que lien ajoute explicitement par lui, c'est-a-dire de maniere ^ ce 
qu'elle soit mise en Evidence. 
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Optionnellement, pour renforcer son action, il va aussi ajouter un lien (vers sa ressource priv6e) 
sur encore (d'autres spots qui lui sont proposes pour) d'autres deuxifemes pages quMl trouve 
pertinentes par rapport k sa ressource privee. 

Dans le futur, un lien vers sa ressource priv6e lui sera spontan^ment pr^sente chaque fois que 
5 I'un des spots qui lui etaient propos6es pour la ou les deuxieme(s) page(s), ou qu*un spot proche, 
lui sera propose pour le ^ontexte courant de sa navigation. 

Ainsi, dans les deux demiers scenarios ci-dessus, un lien vers la premiere page est spontanement 
pr6sente a I'utilisateur chaque fois qu'il va visiter des^ages dans le domaine de pertinence 
convert par les spots proposes pour les deuxiemes pages * 



Selection des spots 

Avant Petape de selection de spot(s) proprement dit, le systeme doit obtenir Tensemble des 
« liens associ6s compl6t6s » a partir de Tensemble des « liens assocife donnds » (qui sont donnes 
par I'utilisateur foumisseur, comme decrit dans le premier scenario d'utilisation). 

15 Completer les liens associds : 

L'ensemble des ressources pointees par les liens associ6s donnfe est la requSte R. 

Le calcul des liens associes comoletfa s'effectue au moyen du proc6d6 de « distillation relative », 
comprenant les etapes suivantes : 

Etape 1 : Identifier 1' ensemble R" des ressources qui possedent au moins un lien pointant sur un 
20 ^16mentdeR. 

Etape 2 : Identifier Tensemble R*^ des ressources point6es par les Elements de R" (noter que 
inclut R). 

Etape 3 : Pour chaque ressource de R*"** calculer son score autorite par rapport a R. (Cette etape 
peut inclure Tidentification d'une partie des ressources de R"^' possedant un lien pointant vers 
25 une ressource de R j . 

Etape finale : Selectionner les Elements de R'^ ayant les plus grands scores autorite. 

Le calcul des scores a r6tape 3 peut s'effectuer en calculant, pour chaque ressource de R"*, le 

rapport entre 

- la cardinality de I'ensemble des ressources qui pointent vers elle ET vers les ressources de la 
30 requSte et 

- la cardinality de I'ensemble des ressources qui pointent vers elle OU vers les ressources de la 

requete 

(ou au moyen de Tune des equations plus completes decrites plus loin, voir notamment 
i'6quation de quantity de raisons communes -ou homog6n6it6- d'un ensemble de ressources). 

35 Les scores autoritfe sont normalis6s (de manifere a ce que leur somme devienne 6gale a 1). 

^"^ Et dans ia mesure ou les deuxidmes pages ont 6t6 choisies par I'utilisateur parce que selon lui elles sont 
pertinentes par rapport h la premiere page, et la relation de pertinence est transitive h ce niveau, un lien vers la 
premidre page est spontandment prdsentd & Putilisateur chaque fois qu'il va visiter des pages qui selon lui sont dans 
le domaine de pertinence de la premiere page ! 
La prise en compte des ressources de R** d6butera d& la premifere iteration, comme decrit plus loin. 
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Les scores autorit^ ^tant obtenus, on peut s'en servir pour attribuer des scores pivot aux 616ments 
deR': 

Etape 4 : Le score pivot de chaque 616ment de R" est obtenu en prenant la somme des scores 
autorite (calcules a 1' etape 3) des elements de R"*" vers lesquels il pointe, Les scores pivots sont 
5 normalises (de manidre k ce que leur somme devienne 6gale i 1). 

Iteration en repartant de T^tape 3: Les scores pivots 6tant obtenus, on peut s'en servir pour 
affmer le calcul des scores autorit6. L' etape 3 tient alors compte des scores pivot pour ne pas 
considerer tous les elements de R" sur un pied d'egalit^ (les ressources de R" pointant vers des 
ressources ayant un score autorite plus 61ev6 auront ainsi une influence plus grande). Les 
10 cardinalit^s utilisees pour calcul er les scores autorit^s sont ainsi remplacees par des cardinalites 
ponder^es. C'est-a-dire que chaque ressource pivot, au lieu de compter pour un, compte 
proportionnellement a son score pivot. (Les equations sont detaillees plus loin). 

L' etape 3 inclut alors la prise en compte des ressources de R"^ pointant vers les ressources de R"^ 
ayant les plus grands scores autorite, en plus de K (un proc6d6 optimis3nt la prise en compte de 
1 5 R"^ est d6crit plus loin). 

Apres I'etape 3 on peut optionnellement effectuer f^tape 4 a nouveau, et ainsi de suite jusqu'a 
convergence, c^est-a-dire jusqu'a ce que la difference entre les resultats obtenus dans la demiere 
iteration et ceux obtenus dans Titdration precedente soit negligeable (en g^n^ral, moins de 10 
iterations sufiisent). 

20 Variante pour Tetape 2 : Pour former R"*", au lieu de prendre tous les liens contenues dans les 
ressources R' le systeme ne prendra que les liens se trouvant dans les regions pertinentes des 
ressources de R*. Comme ces regions pertinentes ne peuvent 6tre determinees qu'a partir du 
moment oii les scores pivot des liens qu'elles contiennent sont connus, on ne mettra cette 
variante en oeuvre qu'a partir de la premiere iteration, c'est-a-dire qu' apres avoir effectu^ Tetape 

25 4 le systeme va iterer en reprenant a partir de I'etape 2 plutdt qu'a partir de I'etape 3, 

Variante pour I'etape 3 : 

A chaque lien poss^de par une ressource de R' (ou de R^') est associd un poids egal au 
complement de la proximite des deux, ressources relives par ce lien. Ainsi, on va affaiblir les liens 
reliant deux ressources proches. On diminue ainsi I'importance des liens entre les ressources qui 
30 se promeuvent mutuellement (par exemple par ce qu'elle font partie d'un meme site Web et se 
citent mutuellement). Une fois que les liens sont ainsi ponder^s, le systeme calculer les scores 
autorite en utilisant non plus la somme des scores pivots, mais la somme des scores pivots 
multiplies par leurs poids (ceci est detailie et illustre par un exemple plus loin). 

La proximite des deux ressources relies par le lien en question est obtenue en calculant le rapport 
35 entre 

- la cardinalite de Tensemble des ressources qui pointent vers les deux ressources reliees et 

- la cardinalite de T ensemble des ressources qui pointent vers au moins une des ressources 
reliees. 

(ou au moyen notamment de Tune des equations plus completes decrites plus loin), 

♦0 11 est aussi avantageux d*efFectuer le meme algorithme par Taval, c'est-4-dire en calculant les 
scores pivot des ressources de R^' (qui citent k Taval les mSmes ressources que la requSte). 



wo 2003/057648 



^/FR2003/000089 



29 

Les algoritfunes par Taval sont identiques h ceux par Tamont sauf que S (backward) est remplac6 
par F (forward) et vice-versa^^ et ' est interverti avec **" (e.g. R'^ est rempIacS par R^'). 

On considerera aussi, avantageusement, !es ressource pivots h I'amont et les ressources autorit^s 
a I'aval, de manifere i ce que les pages pivot dans Tetape ml-1 et les pages autorit6 dans Tetape 
5 ml-i* acquiferent aussi des scores de pertinence (respectivement scores pivot et scores autorit^) 
et puissent ainsi etre inclus dans Tensemble r^ultant foumi k I'etape ml -2 (en plus des URI des 
pages de R"** et/ou de R^"). 

En compl^tant les Hens associ6s de chaque nouvelle requete (spot) introduite, le systdme forme 
une memoire inverse apte a foumir, pour chaque ressource courante potentielle correspondant h 
10 un lien associfi, les requfites les plus pertinentes (c'est-^^-dire les spots les plus pertinents). 

Autrement dit, la memorisation associative comprend maintenant les Stapes suivantes : 

<L'6tape mO est effectuee de maniere independante des autres Stapes. L'6tape ml est effectu6e 
seulement pour les requetes, non d^ja connues par le syst^me ou pas suffisamment fraiches, 
introduites par un utilisateur foumisseur, tandis que Tetape m2 est effectuee pour chaque 
15 utilisation d'une requSte (c'est-i-dire d'un spot) comme support de memorisation associative par 
un utilisateur foumisseur ou un utilisateur final.) 

Etape mO : m^moriser (dans une troisifeme memoire) les droits d'utilisation de spots pour chaque 
utilisateur. 

Etape ml: 

20 L'etape ml-1 correspond a completer les liens associ^s comme d6crit ci avant. 

Etape ml-2 : memoriser, dans une deuxieme memoire, les URI des ressources ayant un score de 
pertinence suffisant par rapport k if, en relation avec R, de maniere a ce qu'a partir de TURI de 
chacune desdites ressources ayant un score de pertinence suffisant par rapport k R on puisse 
retrouver'*^ R ainsi que ledit score de pertinence suffisant; 

25 Etape m2 : (en parallfele avec l'etape ml) m6moriser dans une premiere memoire, pour chaque 
utilisateur et requdte, les liens ajoutes (vers premieres ressources) ; 

Lors de Tacces k une ressource courante par un utilisateur : 

Etape b-m : Selectionner dans la deuxieme memoire un certain nombre de requStes, parmi les 
requites (spots) que ledit utilisateur a le droit d'utiliser (indiqu^s dans la premiere memoire), 
30 pour lesquelles les scores de pertinence de ladite ressource courante sont les plus elev6s (sMls 
existent) et pour lesquels les scores de pertinence des liens associ6s sont les plus proches des 
scores de pertinence contextuels pour ledit utilisateur; 

Etape c : Retrouver dans la premiere memoire les liens ajoutes par ledit utilisateur sur les 
requ6tes s61ectionnees a l'etape b-m, ainsi que les liens ajoutfe par leurs cr^ateurs (s'ils sont 
35 diffferents dudit utilisateur), et les pr6senter audit utilisateur, avec optionnellement : 

- les (ou un certain nombre des) requetes sur lesquelles ils ont 6x6 ajoutes, 

- ainsi qu'un certain nombre de (liens associes vers des) ressources ayant un score de pertinence 
estim6 (k T^tape ml-2) suffisant par rapport auxdites requetes selectionn^es k l'etape b-m. 



B(Ri) est Tensemble des URIs des pages ayant un lien vers la page Rf, FfRf) est Tensemble des URIs des pages 
vers lesquelles Ri a un lien, 
(parmi Tensemble des requetes m^moris^es, le cas ^ch6ant, pour cette ressource) 
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On va maintenant d^tailler le proc6d6 de distillation relative. 

LMd^e essentielle du calcul du score de pertinence (d'une page Web P2 par rapport k une page 
Web donn^e Pi) est la suivante"*^ : 

Soit/7; la probabilite"*^ qu*un auteur al^atoire (de page Web) mette dans une page un lien sur Pi. 
5 So\ip2 la probabilite qu*un auteur aI6atoire mette dans une page un lien sur P2. 

Soit Pi ^2 la probabilit6 qu'un auteur al6atoire, mette dans une page un lien sur Pj et un lien sur 

Pi^ 

B(Pi) est Tensemble des URIs des pages ayant un lien vers la page Pi. 

F(Pji) est I'ensemble des URIs des pages vers lesquelles Pi a un lien. 

10 La pertinence d'une page par rapport a un ensemble de pages peut etre definie par la « quantite 
de raisons communes » d'Stre interess6 par toutes ces pages. 

Des calculs algebriques permettent d'obtenir des equations donnant la quantity de raisons 
.communes entre plusieurs pages. Cette quantite (ou proximite, ou encore homogeneity) est notee 
X, avec en indice les pages dont 11 est question ; la probabilite d'etre l\€ k une certaine page est 
1 5 notee pi ; la probabilite d' etre lie a au moins une page parmi Pi, jPj, . . Pn est notee Pij.,^. : 

— _ Pi ' Pj ^ ~ _ ^ ^ ^ ^ et ainsi de suite (tous les sous-ensembles de taille impaire 

P^'Pij P^'Pij'Ptk'Pjk 
au numerateur, et les autres au denominateur)"*^. 

Cette equation peut etre not6e de fa9on plus compacte ainsi : = J^p^ avec o-p = (- 1)^'*' . 

PcS 

Les probabilit6s dont il est question ci-dessus font intervenir le nombre (le comptage) des pages 
20 de R' qui contiennent un lien donn6 ou un lien parmi un ensemble d'URI donnes (vers des pages 
de K ). On gagnerait a ponderer ce nombre par Ja qualite de citation (score pivot, decrit plus 
loin) de chaque page qui contient un tel lien. 

On voudrait ainsi qu'une page de K citant plus de meilleures pages (de i2"^) soit consid6r6e 
comme 6tant de meilleure quality de citation, et qu'en retour un poids plus fort lui soit dorm^ 



Ci-aprds, nous allons consid^rer que Pi et P2, (ou P/, Py, etc) sont des pages Web, bien que les procddfe ddcrits 
soient bien plus gSneraux, comme on I'a d^j^ mentionn^. Par exemple, il est a noter qu'au lieu d'exploiter les liens 
hypertextes et les requites comme mentionnfe ci-dessus, le syst^me peut Stre bas6 sur une analyse des traces des 
copier-coUer (ou couper-coller) de fragments d' information effectuds par les utilisateurs (dans le cadre des creations 
et manipulations de ressource d'information), pour sugg^rer automatiquement d'autres fragments qui sont 
susceptibles d'enrichir ces ressources. Ces traces peuvent en efFet 6tre assimil^es i des liens. Par exemple, quand on 
copie une partie d'une page Web dans un document, le syst^me est capable d'en d6duire et de m^moriser I'existence 
dans le document d'un lien vers la page Web, et les m§mes m6canismes d6crits ici peuvent alors etre appliqu^. Par 
aiileurs, le proc^d^ que I'on decrit ici peut avantageusement €tre applique en assimilant les liens d'lme ressource 
vers une autre ressource a des Hens d'un utilisateur vers une ressource qu'il aime (c'est-a-dire vers une ressource qui 
I'int^resse). On peut ainsi determiner la quantite de raisons communes (entre plusieurs ressources) d'Stre aim^es par 
des utilisateurs. Ceci peut notamment servir k cat^goriser ces ressources. 

La probability d'6tre intdress^ par une (ou certaines) page(s) est approchde en comptant le nombre de pages qui 
ont un lien sur elle(s) et en divisant ce nombre par une estimation du nombre de pages qui auraient pu en avoir. 

Les barres sup6rieures indiquent des complements, et po, la probability d'aimer au moins une page d'un ensemble 
vide, est une constante dgale & zdro ; elle est prdsente dans rdquatton pour des raisons de coherence. 
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dans le cadre du calcul des scores'*'* des pages qu'elle cite (R"^y les scores des pages de et ceux 
des pages de R'^ s'influen9ant mutuellement dans une approche iterative (de renforcement 
bipartite) qui converge"*^. 

Le nombre de pages de citant cfeaque page candidate (c'est-a-dire de intervient aussi 
5 dans les calculs. Or leur prise en compte coQte cher. On va alors approximer les resultats en ne 
consid^rant que celles qui citent les pages candidates ayant un bon score, ce score 6tant calculi 
d'abord en ne considerant que 72' et ensuite en etendant cet ensemble vers R^^ progressivement. 

Pour calculer le score de pertinence d'une page candidate, au lieu de prendre le resultat de 
r^quation de quantite de raisons directement, il est pr^fSrable 

10 de la prendre avec les cardinalites d'ensemble remplacees par le total des scores pivot des 

pages en question et 

• de multiplier ce resultat par le score autorit6 de la page candidate (simplement calcule k 
partir du total des scores pivot des pages citantes), afin d'affaiblir ainsi les pages qui sont 
relativement moins fiables (car moins populaires). 

1 5 Apres une premiere iteration, dans les pages citantes le systeme peut 

• reiperer Jes regions contenant des liens diriges sur des pages de R^ ayant un bon score 

• et commencer deja k elaguer les lipns qui ne sont pas situes dans ces regions. 

Comme les liens en question se trouvent places sous des noeuds d'une structure typiquement 
arborescente de document (tel qu*en HTML notamment), pour determiner une region de 
20 pertinence il suffit de prendre les noeuds (minimaux) qui englobent tous les bons liens et de leur 
retrancher les sous-noeuds (maximaux) qui contiennent un mauvais lien (score trop faible, ou 
URI explicitement refuse) et qui ne contiennent pas de bon lien (score suffisant). 

L'algorithme permet, ayant un ensemble homogene (ayant une homogeneity suffisante) d'URIs 
associ^ h des pages proches, d'obtenir une liste d'URIs de pages qui sont pertinentes 
25 relativement a cet ensemble. II sera d^crit plus loin comment exploiter cet algorithme pour 
obtenir un ensemble de pages pertinentes pour un ensemble irihomog^ne. 



En entree, cet algorithme prend 

• un ensemble K d'URIs de reference (« Kernel ») 
30 • un ensemble A d'URIs candidats (« Authority ») 

• un ensemble H d'URIs candidats pivots (« Hub » ou « Pivot » en fran9ais) 

• un ensemble T d'URIs a refuser (« Trash ») 



Rappelons qu'il s'agit ici de scores de pertinence par rapport h la requite, contrairement de P6tat de la technique 
qui permet de determiner un score de qualitd « dans Tabsolu ». 

Noter que le calcul du score de pertinence d'une page de R"* peut rdsulter en une valeur negative (que Pon va alors 
neutrallser ; ceci est d^crit plus loin). En effet, certaines pages peuvent €tre, non seulement pas proches de la requite, 
mais meme antagonistes par rapport i elle (le feit d'y etre int6ress6 diminue les chances d'aimer les pages de la 
requ8te et invers^ment). 
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Ona : K~ <zH(zA-etTnK^0.QS. itmt un ensemble d'tHUs, E" = [j B{P,} et E* 

=Uw,)) 



ReE 



I . -.46 



1. Associer a chaque page Pi de un nombre hiy mis initialement — r , son score pivot' 



son score autorit^, 6gal ^^Iji'hj , ou Ijj = 

J 



2. (Re-)calculer les scores autorite : 

a. Pour chaque page F/ de A, en commen9ant par celles de associer un nombre a^, 

0 s' il n* y a pas de Hen enire Pj et Pj 

1 s* il y a un lien entre Pj et Pj 



b. Une optimisation possible mais dangereuse : si, pour certaines pages, a/ est 

5uffisamment proche de sa valeur calcul^e pr6c6demment (le cas iSch^ant), tet que les scores 
autorite des pages de K n'ont pas varie non plus, nous pouvons garder Pancienne valeur de 
10 pour cette page, pour economiser les calculs. 

3, (Re-)calculer les scores de pertinence : 

a. Pour chaque page Pi de A calculer r/, 6gal a w^^^. 

IS et dans le cas oix le resultat est negatif (cas d'une page antagoniste k S) neutraliser les liens 
entrants de mani&re k avoir r/ = 0 . 

L'homog^n^it^ par Pamont ws d'un ensemble iS est d^finie comme suit: 

^5 ~n^^^' »oii 



P<zS 

i P contient un nombre pair de pages 
I sinon 



_ f-lsil 
" [+lsir 



20 ■ Op "^^^hjljp oil 

J 

A est une constante arbitraire inf^rieure mais proche de 1 (elle sert a eviter des divisions par z^ro 
mais ne change pas le principe de Palgorithme. Si Pensemble H est plus grand que K" alors cette 
constante peut 6tre ^gale k un 

_f+lsi3P,eP|/„=+l 
0 sinon 



Ainsi, avantageusement, la somme des |H| scores hf est ^gale k 1. 
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0 s' il n' y a pas de lien entre Pj at Pj 

1 s'il y a un lien entre Pj et 

En d*autres termes, Ij^ est egal h 1 s'il y a un lien 

• d'une page Pj (de H) 

• k au moins une page P, de P 
5 et zero sinon. 

Ceci signifie tout simplement que est le total des scores pivot des pages (de H) qui pointent 
sur au moins une page de P {P 6tant le sous-ensemble courant de S qui est consid6re). 

Pour chaque lien Iji existant on pent lui associer un poids en fonction de la proximite des pages 
1 0 Pi et Pj et ameliorer ainsi le resultat - voir plus loin, 

Ici, puisque VP^ e AT on a r."^ = w^r (la pertinence est la meme pour toutes les pages F/ de JK)? ^® 
score de pertinence r^ ne doit etre calculee qu'une seule fois pour les pages de K (elle sera 
d'ailleurs d^ja calculee lors de la procedure de d6coupage de la requSte R en sous-requetes 
15 (noyaux) isT, et sera done d^ji connue k Tentree de la procedure). 

b. (Ce point sera saute la premiere fois.) Pour avoir leur somme 6gal A 1, on doit 

diviser chaque rt par la somme ^® toutes les valeurs absolues des rt* So it 



•'=1: 



, la variation globale du score de pertinence. 



20 Si 8<B (e>0 etant une marge d'erreur), on considfere avoir converge et le proc^dd s*arr6te. Sinon, 
le procede continue. 

^+ 

c. On remplace r\ par — ^ 



+ 



on pent aussi utiliser un facteur de frottement r : 

+ 

25 r, H> rr, +T — — r .(re [0;l[, on prendra de pr6f(Srence une valeur tres petite e.g. 0.01 pour que 

SKI 

dans les cas ou ce n'est pas necessaire le nombre d'iterations ne change pas) 
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4. "^^Pour chaque page Pfd^H: 

a. Trouver tous les liens qui pointent sur une page ayant un score de pertinence plus 

grand qu'un seuil epsilon h choisir ( e>0 ). 

5 b. Trouver 4 le plus petit 6I6ment HTML contenant la totality des liens trouv^s au 

point a ci-dessus. 

c. Pour chaque lien pointant sur une page de T (si T n'est pas vide), trouver le plus 

grand Element HTML le contenant (s'il y en a) et ne contenant pas de lien trouve au point a. ci- 
dessus, et Tenlever de //. 

10 d. On garde tous les liens restant dans // et on supprime les autres (ou bien on les 

neutralise en mettant leur lij k z6t6) 

5 . Recaiculer les scores pivot: 

a. Pour chaque page P{ de /f, calculerft/ =^/yr,. , la somme des scores de 
1 5 pertinence des pages pointees. 

b. hf H> — ^ — r 

2:|vi 

(La division par ®st, comme pour le score de pertinence, pour garder leur sonune 6gale h 

1)- 



20 Ensuite retoumer au point 2. 

Initialement, pour ne traiter qu'un nombre r^duit de pages, les scores de pertinence peuvent etre 
calculus sur la base de R' (si on avait pris H^R'). Ceci ne sera alors qu'une approximation. En 
effet, pour que les scores soient corrects, il faudrait les calculer en se basant plut6t sur H^'R''^'. 
25 Mais comme la constitution de if""*" est relativement coQteuse, on ne prendra qu'un sous- 
ensemble : on prendra pour R^' seulement les pages pointant sur les pages de A qui ont un bon 
score. 

Ainsi'*^ on va aj outer une sous-etape avant la fin de I'etape 2.a : 

2.a.L Dans le cas ou le score rj*' de la page courante (P,- de A) est suffisant^^, on recalcule ri^ 
30 apres avoir insert dans H les nouvelles pages de B(Pf) 



Ce point peut eventuellement §tre ignore apr6s la premiere fois. 
(ou autre representation analogue...) 

Plusieurs mdthodes peuvent €tre utilis^es ; nous prdsentons ici la pr^f^r^e. 
^ (c*est-^-dire supdrieur k un seuil choisi ; ce seuil pourra etre fonction de la cardinalite courante de en effet plus 
on se rapproche de (e.g. H/i^iy) plus le score calculi a des chances d' toe ddji correct) 
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On introduit un score autorite pour les pages de A et T^quation ri^ est r = w^^^ - a, (plutot que 
r = ). Le nouveau coefficient a,- permettra d'affaiblir les pages peu fiables (par le fait qu'ils 
5 sent peu populaires). En outre, T Equation sera plus coherente dans la mesure ou le score 
pertinence ne sera plus le mSme pour toutes les pages de la requgte. 

La procedure est maintenant la suivante ; 

1 . Ce point est le meme que celui de l*algorithme de calcul de scores de pertinence prdsent^ 
plus haut. 

10 2. Ce point ne change pas non plus. 

3- (Re-)calculer les scores de pertinence : 

a. Pour chaque page P, de A calculer r,"*", egal a w^^^ -a^ et dans le cas oii le r6sultat 

est n^gatif (cas d'une page antagoniste a R) neutraliser les liens entrants de maniere a avoir 

15 b. Poursuivre a partir du point 3.b de Talgorithme de calcul de scores de pertinence 

pr^sente pr^c6demment. 

Filtrage : 

Pour chaque lien Iji existant on peut lui associer un poids en fonction de la proximite des pages Pj 
20 et Pj et ani6Iiorer ainsi le r6sultat. Cela permet de diminuer T importance des liens entre pages qui 
se promeuvent mutuellement. Typiquement on arrive ainsi h filtrer par exemple les liens des 
« sommaires » et autres « menus » qui, de maniere repetitive, se trouvent dans toutes les pages 
d'lm site. 

L*idee de base consiste k affaiblir les liens reliant deux pages que nous savons proches, en 
25 affectant un poids a chaque lien, poids qui sera egal au complement de la proximity des deux 
pages reliees (plus la proximite est grande, plus le lien doit 8tre affaibli). Une fois que les liens 
sont ainsi pond6r6s, il est possible de calculer rhomog^n^ite d'un ensemble de pages en utilisant 
non plus le nombre de pages citantes, mais la somme de leurs poids. 

Au point 3.a de Palgorithme, on remplace dans la definition de du score autorite ^hjljp par 

J 

30 ^hjijp ot =min|^l;m^(/^, -XyJJ 
Explications : 

• Ijf ' est le complement de la proximit6 entre la page Pj et la page P, sMl y a un lien 

de la page Pj k la page Pj , et z6to sinon 
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• maxt „ -X ;) est le compl6ment de la proximity entre la page Pj^H &i question et la 
pageP, e P pour laquelle le lien entre P^ et P, pr^sente la proximity minimum 

« minj^l; max(/^, • x^)] signifie que cette valeur est tronqu6e sup6rieurement ^ 1 

{0 s'il n' y a pas de lien entre Pj et Pj 
Is'ilyaunlienentreP.etP, 

5 En d'autres termes, s'il y a au moins un lien 

• de la page Pj (de H) en question 

• ^ une page Pi de P, 

est 6gal au complement de la proximity entre la page Pj et la page P, qui lui est la moins 
proche et vers laquelle elle poss^de un lien. Y^l ^f, est la somme des poids ainsi assocife aux 
10 pages de H qui pointent sur au moins une des pages du sous-ensem1>le P consid6r6. 

Pour determiner la proximit6x^„ on peut prendre r6quation de quantity de raisons communes 
(dejStdecrite): = - ■- 

Pa • PaB 

15 La figure 6 pr^sente un exemple ou le nombre de pages pointant sur la page A est egal k 
0.9+0.2+0.4+ft 8^.3 

Le nombre de pages pointant sur la page B est ^gal aOJ+fti+0.3+0.5=1.8 

Le nombre de pages pointant sur A ou B (N pab) est egal k 0.9+0.2+0^ft«+0.3+0.5=3.6 

Ainsi. si on considere que |//| + ^ = 1 00 , le calcul de la proximity de A et B donne : 

20 7" = = ^•^'^^ • ^-^^^ . ce qui donne 5e^« =i^« 0.264 = 26.4%. 

P. 'Pab 1- 0-964 Pb 

Le filtrage decrit ci-dessus utilise un poids xj,. Puisque nous avons maintenant les scor es^' des 
pages citantes, nous pouvons optionnellement araeiiorer le proc6d6 en pienant Xj, -hj comme 
poids (au lieu de S^), oil hj est le score de la page citante (afFaiblir un lien (d'une page citante 
Pj k une page cit6e P/) davantage quand le score de la page citante Pj est faible. 
25 II est k noter que pour calculer la proximity Xj, entre deux pages P, et Pj reliees, au lieu d'utiliser 
requation de quantity de raisons comme illustre ci-dessus, on peut effectuer le rapport entre : 



" (que ce soit de manifere absolue ou par nqpport 4 la requSte) 
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- la cardinality de Tensemble des pages qui pointent vers Pi ET Pj 

- et la C£u:dinaUt6 de T ensemble des pages qui pointent vers Pi OU Pj . 
Datermination des sous-ensemble homogfenes d'une requite : 

On foumit au systdme un ensemble R de pages et 6ventueliement un ensemble de pages Rx de 
5 pages qu'on ne veut explicitement pas ( iJ n jR^^. = 0). Le syst^me va identifier au sein de R au 
moins un groupe de pages « homogene » et va lancer une sous~requ§te s^paree sur ce ou chaque 
groupe, Ces groupes sont appelles « kernel » (ou noyau). Pour former la r^ponse on prendra 
ensuite une combinaison des scores obtenus> Ce proc6d6 comprend ainsi les etapes suivantes : 

1 . Pour chaque page Pi de R^ trouver B(Pi), Pensemble de pages citant Pi. 
1 0 2. Trouver if ' = (J ) , 1 'ensemble de pages citant au moins une page de R. 

3. Dans les pages de R qui ne sont pas encore dans un noyau (au debut aucune ne I'est), 
trouver ta page Pb ayant le plus grand ensemble B(Pjs) de liens entrants^^, et creer un noyau 
contenant seuiement cette page. Ce noyau est maintenant Kcy le noyau courant en construction (a 
tout instant il tfy en a qu'un seul). Si toutes les pages se trouvaient dans au moins un noyau alors 

1 S passer au point six. 

4. Trouver les pages pertinentes par rapport k Kc (en utilisant Talgorithme de calcul de 
scores de pertinence) avec 

o H-^R" 

o 4^R 

20 o K^Kc 

o T^Rx 

5. Soit Pu la page de R, pas encore dans Kcy qui a le score de pertinence le plus 61eve. Si 
son score de pertinence est infdrieur h un score minimal fix6, retourner au point trois. (le noyau 
courant est maintenant complet). Sinon Tinserer dans Kc et repasser au point quatre. A noter 

25 qu'il ne sera pas necessaire de r^initialiser les scores pivot et autorite, il est preferable de garder 
les demieres valeurs calcul^es, ainsi la convergence devrait etre tres rapide. 

6. On a maintenant un ensemble de noyaux (sous-requStes homogenes par Tamont) prStes a 
8tre utilis6es comme decrit dans ce document. Lorsqu'on veut calculer les scores de pertinence 
globalement k toute la requSte on fait une moyenne arithm6tique des resultats pour chacun des 

30 noyaux. 



En variante, au lieu de se baser sur P^quation d*homog6n6it6 x^^Y^Pp comme decrit 

Pes 

jusquMci, le proced6 de calcul de scores de pertinence peut Stre base sur une autre Equation 



Dans le cas ou on a les scores autorit^ des pages, ou autre score de popularity, on pr^f^re se baser plutdt sur eux. 
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d'homog6n6it6, comme par exemple Xs = 



ou encore — 



Max\BW\ 



. P,gS 

dans lesquelles les cardinalit^s d*ensemble (repr6sent6es entre barres verticales) sont remplac^es 
par le total des scores pivot des pages en question^^. 



5 Traitement par Paval : 

Au lieu de chercher les bonnes pages relativement a celles d'un noyau parmi les pages qui sont 
cities en commun avec eiles il peut etre interessant d'effectuer les memes algorithmes dans 
Tautre sens, i.e. en cherchant pexmi les pages qui citent les m€mes pages que le noyau, voire 
m§me d'effectuer les deux et de calculer une moyenne arithm^tique. 

10 Les algorithmes par Taval sont identiques a ceux par Tamont sauf que B est remplace par F et F 
est remplace par B, et ' est interyerti avec {par exemple R'^ est remplac6 par R^'), 

Les precedes par Tamont et par raval peuvent etre avantageusement int6gres de la manifere 
suivante : Aprfes le traitement par ramont (eventuellement meme aprfes chaque iteration amont), 
aux pages candidates (R'^ ayant obtenu un score de pertinence suffisant, on associe a I'aval un 
15 ensemble de pages suppldmentaires (« pages artificielles ») dont la cardinality est fonction dudit 
score de pertinence. Chaque page artificielle est aussi citee par (au moins) une page de la requete. 
On donne ainsi k I'aval un «avantage » aux scores de ces bonnes pages (de R"^) trouv^es par 
ramont^"*, et par consequent on donne aussi indirectement un avantage aux scores des pages (de 
Jf"*""*") cities le cas echeant par ces bonnes pages. 

20 Et reciproquement, apres le traitement par I'aval (Eventuellement meme apres chaque iteration 
aval), on applique k Tamont le meme procede de meuii^re sym6trique. On favorise ainsi les 
bonnes pages de R^' et indirectement les pages (de R'^ qui les citent le cas ech6ant. 

Lt fait de ne pas amal gamer les scores par I'amont (des pages R'^) avec les scores par Taval 
(pages R^') perraet de les dissocier dans les calculs. Notamment, on peut diminuer I'influence 
25 des scores obtenus par I'aval dans ies traitements par I'amont ou vice-versa. 

Par ailleurs, grace k cette id6e de « pages artificielles », le present procedE peut fitre appliquee en 
complement aux m6thodes existantes dans Tetat de la technique. En effet, une fois les scores 
obtenus pour chaque page, on peut modifier artificiellement les nombres respectifs des pages 
citantes et cities avant d'appliquer ces m^thodes. 

30 On peut arpenter (« crawling » en terminologie anglo-saxonne) le Web en suivant les liens (en 
amont et en aval) autour des pages des 7 ensembles pr^cedemment citees, en tirant parti de 
Tajout des pages artificielles pour avantager les pages Web li6es aux pages qui sont plus 
pertinentes par rapport k la requete. 

Dans la mesure ou les pages ayant les meilleurs scores sont cens6es etre tres pertinentes pour 
35 I'utilisateur (et dans la mesure oCi la pertinence est transitive), les procEd^s dterits ici pourront 



On peut dire que Pon remplace les cardinality par des <c cardinalitds pond^r^ », les poids 6tant les scores hub. 
Noter que, avantageusement, ceci se &it sans amalgamer les scores de pertinence par Tamont et par Taval. 
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Stre r^cursivement appliques sur ces dernieres pour d^couvrir encore d'autres pages pertinentes. 
On peut ainsi arpenter le Web k partir de la requfite de I'utilisateur. 

La figure 7 pr^sente de manifere sch^matique un tel proc^d6 : la recherche de pages pertinentes 
peut fitre appliqu^e r^cursivement en etendant la requdte avec les « Bonnes pages trouvees par 
5 Tamont)), « Bonnes pages trouvees par I'aval », « Bonnes pages pivot » et « Bonnes pages 
autorit^s » qui dans la figure sont encadres par des rectangles. A chaque recursion, les scores des 
meilleures pages trouvees deviennent un peu plus faibles (par le fait que les meilleures pages 
trouv6es sont a chaque fois ajout^es dans la requSte) et le proc6d6 s^arrSte qu^d les scores 
cessent -d'etre suffisants, 

10 Un systSme mettant en ceuvre le procede de distillation relative d^crit ci-dessus est apte a 
recevoir une requete de recherche composee d'un enserrible d'URJ permettant d'acceder a des 
ressources d' information telles que des pages Web et foumir en r6ponse les URI (ou directement 
les pages) qui sont census etre les plus pertinents par rapport h ladite requete . 

La requSte peut par ^xemple Stre constit«6e des liens favoris de I'utilisateur, le but du systfeme 
15 6tant par exemple de surveiller le Web autour de ces liens et de notifier Tutilisateur quand de 
nouvelles pages interessantes y apparaissent, soit en technologie « Push » a Tinitiative d'un 
serveur, soit en technologie « Pull » h Tinitiative de i'utilisateur, 

L'utilisateur peut bien sflr directement foumir au systdme un ensemble d'URI, neanmoins, 
d'autres moyens peuvent aussi lui Stre offerts pour I'assister dans la preparation et la soumission 
20 d'une requSte de recherche. 

Pour declencher Texecution d'une requete de recherche k partir d'un lien hypertexte se trouvant 
dans une page, I'utilisateur peut utiliser Tun quelconque des dispositifs parmi les suivants : 

• Un objet graphique activable par exemple par clic (e.g. un bouton) est pr6sent6 k proximity 
de certains liens hypertextes (URI) dans une page Web. Son activation d^clenche Tenvoi d'une 

25 requete de recherche contenant I'URI en question. 

• Le systeme est dote d'un moyen apte a basculer la page dans un etat oCi chaque clic sur un 
lien d6clenche I'execution d'une requete de recherche (contenant ce lien). 

• Une touche du clavier, telle que la touche « Ctrl », appuy^e alors que I'on clique (par un 
moyen de pointage) sert k declencher Tex^cution d'une requSte de recherche k partir du lien sur 

30 lequel curseur du moyen de pointage est positionn^. 

• Le bouton droit de la souris (ou equivalent) sert a declencher I'execution d'une requdte de 
recherche a partir du lien sur lequel le curseur de la souris est positionne, 

• Autre dispositif analogue. 

Chacun de ces dispositif peut avantageusement permettre d'ex^cuter ladite requdte de recherche 
15 en plus de (en parallele k) I'acces a la page designee par le lien en question, Le r&ultat de la 
requete de recherche sera par exemple afFich6 dans une deuxidme fenetre (nouvelle instance du 
navigateur) ou encore dans une sous-fenStre du navigateur^^. 



De mani^e analogue h la sous-fen8tre existante aujourd'hui pour les Hens iavoris, cette sous-fen6tre peut §tre 
adjacente k la sous-fenetre principale dans laquelle 6tait affichde la page contenant le lien que Putilisateur a clique et 
dans laquelle est ensuite affich^e la page acc6d6e par le fait de cliquer sur ce Hen. 
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En supplement du lien selectionn6, d*autres URI peuvent 6tre ajoutds d'office dans la requ§te de 
recherche^^. Ceux-ci peuvent notamment etre: 

• les liens se trouvant dans la page, dans la region de rURI s6Iect!onn6 ; 

• les URI pr6c6demment selectionn^s par futilisateur pour cette mfime requSte au cours de sa 
5 navigation^^ ; 

• des liens explicitement prdvus et de preference determines par le concepteur de la page pour 
accompagner TURI select ionne ; 

^ les URI qu'un autre utilisateur (« mentor » ou referent) consid^re comme etant tres pertinents 
par rapport h PURI seiectionne, le mentor etant determine automatiquement par le systeme, ou 
10 specifie par I'utilisateur lui-meme (choisit dans une liste de « copains » qu'il a au prealable 
memorisee dans le systdme), ou encore propose par le concepteur de la page (Putilisateur peut 
aussi choisir dans une liste d' « experts » proposes par le concepteur de la page). 

Preparation d'une requete : 

On va maintenant decrire comment I'utilisateur peut preparer une requfite composee de plusieurs 
15 liens qu'il glane au cours de sa navigation. 

a) Affichage de la requete courante en preparation 

Au lieu de declencher directement une requete de recherche, Paction de I'utilisateur (comme 
decrit plus haut, par exemple le fait de cliquer sur un lien avec le bouton droit et choisir I'option 
appropriee) dedenche r affichage d'une page accessoire dans laquelle : 

20 • en plus du lien que Tutilisateur vient de seiectionner^^, d'autres liens, qu'il a le cas echeant 
precedemment seiectionnes pour cette meme requete, sont presentes ; 

o des cases a cocher peuvent etre affichees en association avec chaque lien presente, de 

maniere k ce que rutilisateur puisse notamment selectionner ceux qui vont effectivement former 
la requete; 

25 • ladite page accessoire est aussi munie d'un moyen d'entree (tel qu'un bouton) permettant de 
lancer la requSte de recherche. 

Ainsi I'utilisateur peut preparer une requite progressivement, en seiectionnant des liens les uns 
apres les autres^^ lors de sa navigation et ensuite envoyer une requete composee de plusieurs 
URI. 

30 Ladite page accessoire peut en plus contenir des objets graphiques depliables (comme par 
exemple des repertoires, casiers, dossiers, ou metaphore analogue) representant des requStes en 
preparation autres que la requete en cours. L'utilisateur peut ainsi choisir la (ou les) requSte qui 
sera enrichie par le nouveau lien quMl vient de selectionner. 



En effet, un des avantages essentiels du systeme est de pouvoir fonctionner (trouver les ressources dMnformadon 
pertinentes) meme si la requete de recherche est composee d'une pluralit6 d*URI. 

Les nouveaux URI trouvds par le systeme sont alors mis en Evidence dans le r&ultat retoum^ k Tutilisateur (pour 
les distinguer des URI qui avaient d6jk it6 retoum^s dans la m€me navigation). 

(ainsi que des liens ajoutes d 'office, le cas echeant, comme decrit ci-avant) 

(dans une m3me page ou dans des pages differentes) 
^ (lors d'une m€me navigation ou de mani^re plus espacee dans le temps) 
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Suite k la preparation d'une requdte '^ partir d'un URI correspondant k un lien hypertexte dans 
una page (comme decrit plus haut), les requStes d6}k existantes qui le cas ^ch^ant contiennent cet 
URI lui sont optionnellement presentees. 

Avantageusement, ladite page accessoire peut etre composee de deux parties. L'une de ces 
5 parties contient les elements decrits ci-dessus (c'est-^-dire les elements de la requSte en 
preparation). L'autre partie presente le contenu de la page designee par le lien selectionn6 par 
I'utilisateur. 

Par exemple, si Tutilisateur clique sur un lien alors que la page est a Vetat ou tous les clics 
declenchent Taffichage de la requete courante en preparation (ou avec le bouton droit de la 
10 souris, etc), le serveur lui retoume ladite page accessoire qui comprend ainsi : 

• dans une partie : les elements de la requete en preparation 

• et dans Tautre partie : le contenu de la page designee par le lien clique. 

Ainsi, le fait d'utiliser le systfeme represente un avantage important par rapport k la navigation 
classique sur le Web : I'utilisateur re9oit non seulement la page designee par le lien quMl a clique 
15 (c'est la navigation classique sur le Web), mais en meme temps il beneficie de la possibilite 
d*envoyer une requSte (contenant plusieurs URI) pour obtenir encore d'autres ressources 
pertinentes en relation avec cette page. 

En variante, ladite page accessoire est retoumee apres une execution rapide (voire restreinte'^^) de 
la requete de recherche en cours a laquelle le lien clique a ete ajoute. La deuxieme page contient 
20 alors directement une partie du resultat^^. L'utilisateur re9oit alors non seulement la page 
designee par le lien quMl a clique, mais en plus il beneficie directement d'autres ressources 
pertinentes en relation avec cette page. 

Plus avantageusement encore, ladite page accessoire peut etre affichee dans une sous-fenStre^^ 
adjacente a la sous-fenetre principale du navigateur. Cette sous-fenetre adjacente s'ouvre en 
25 reponse k Taction de Tutilisateur qui souhaite Taffichage de la requSte en preparation (c'est-i- 
dire ladite page accessoire).^ 

La requete en preparation peut ainsi etre affichee en parallele (de maniere asynchrone) a 
Taffichage de la page designee par le lien clique; cette demiere s'affichant (independamment) 
dans la sous-fenStre principale, 

30 Le resultat de la requete de recherche peut ensuite etre presente dans la m6me sous-fenStre 
adjacente. 

Comme mentionne precedemment, un resultat (partiel) peut eventuellement etre retoume apres 
execution partielle ou restreinte de la requSte de recherche en cours, requete a laquelle le lien 
clique a ete ajoute. La sous-fenetre adjacente presente alors directement un resultat rapide de 
35 recherche (qui sera eventuellement complete par la suite). 



Dans le cas d'une requite sur des pages d^j^ crawl^es, le syst^me peut directement retoumer les URI (ou pages) 
pertinents d^ja connus et retoumer la suite des rdsultats en differ^. 

(par exemple sous forme d'une liste d'URI ou un ensemble de vignettes repr&entant ces pages en miniature) 

(analogue k la sous-fen§tre des liens favoris des navigateurs actuels) 
^ Noter que, en parallele k Taffichage de la requite en preparation, le serveur peut avantageusement d^j^ ^ ^ 
commencer k arpenter le Web (crawling en teraiinologie anglo-saxonne) -c'est-i-dire constituer JV, R^, /T , , /? 
et R*^ comme d6}k decrit- autour du lien sSlectionnS. 
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b) R6sultat de l*ex6cution d'une requSte de recherche 

Pour chaque requgte de recherche, le serveur peut retoumer les resultats directement (par 
example en retour de la requete HTTP) ou en diff6r6 (par exemple par email). 

Le serveur retoume les URI (resultant d'une requete) dans une page prSsentant la meme structure 
5 que ladite page accessoire (ou ladite requSte en preparation), a savoir : 

• des cases a cocher sont assocides aux liens de maniere a ce que Tutilisateur puisse 
s61ectionner ceux qu'il appr&ie et supprimer ceux qu'il n'appr^cie pas^^ 

o chaque URI^ peut ainsi Stre dans au moins Tun des etats suivants^^ : suggerS (etat par 

defaut), accepte ou supprimd (les URI qui sont k T^tat supprim^ ne sont pas pr^sent6s); 

10 • la page est munie d'un moyen d'entrte (tel qu*un bouton) permettant de relancer la requSte 
de recherche. 

La page retoumee presente egalement les autres requetes (du meme utilisateur) sous forme 
d*objets graphiques d^pliables, comme dej^ d^crit. La presentation de celles-ci peut etre 
hi6rarchisee selon leur pertinence par rapport au iien cliqu6 (selon les proc^des de calcul de 
1 5 pertinence d^crits plus loin). 

La page retoumee presente des moyens de commande permettant a Tutilisateur de creer de 
nouvelles requetes et supprimer des requetes existantes. Bien entendu, Tutilisateur peut copier- 
coUer des URI k partir de requStes existantes ou de n'importe quelle autre ressource. Et lorsque 
le resultat d'une requete est retoume par le serveur, I'utilisateur peut deplacer (ventiler) les URI 
20 refus dans d'autres requStes. Chaque requete est accessible individuellement au moyen d'un URI 
qui lui est propre. 

Maintenance des spots 

On a decrit jusquMci plusieurs procedfo qui utilisent la m^thode de distillation relative, en partant 
25 d'une requete (e.g. les liens associ^s donnes d'un spot) compos6e d*un ensemble d'URI, pour 
determiner et m^moriser des URI pertinents (e.g. les liens associes completes d'un spot) par 
rapport a cette requete, avec leurs scores de pertinence. Ces resultats memorises sont obtenus sur 
la base de comptage de liens se trouvant dans les ressources des ensembles i?"*", K^'^ ii*^", if"*""*, 
i?*^"^, r'"^'^'^ etc. qui sont eux-memes memorises du moins en partie. Or ces ensembles varient 
30 dans le temps (et les liens se trouvant dans les ressources constituant ces ensembles varient 
aussi). II faut done tenir k jour les donn^es memorises et refaire les calculs quand les donn^es 
qu*ils prennent en entree varient de maniere significative. 

Par ailleurs, il est souhaitable de d&eler de nouvelles ressources pertinentes avant meme que des 
liens pointant vers elles n'apparaissent sur le Web. On va maintenant d&rire un proc6de 
35 permettant de le faire. 



(c'est-^-dire demander au syst^me de ne plus les suggdrer) 
^ Optionnellement, la pr^entation du r6sultat d'une requ6te de recherche inclut le contenu des pages (pointdes par 
les URI resultants) par exemple sous forme miniaturisde (vignettes). 

Accessoirement, une possibilitd de copie (« gel ») de page (en local ou dans un espace personnel sur un serveur) 
peut aussi dtre ofFert ^ rutilisateur. Chaque lien peut alors €tre dans un des 6tats suivants : suggdrd, acceptd* 
suppnm6 ou geid. 

/T*", R^"^ et i?*'**'sont notamment utilises pour calculer la proximity de ressources lides, et filtrer, comme d^rit 
plus haut, en prenant le complement de cette proximity comme ponddration du comptage des liens en question. 
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Pour chaque requite (par exemple pour chaque spot), 

- selectionner un premier ensemble de ressources ayant les plus grands scores de pertinence (tels 
que les plus grands scores pivots) pour ladite requite 

- determiner les regions pertinentes (c*est-a-dire les regions possedant des liens vers des 
5 ressources dont les scores sent 61ev6s en moyenne) dudit premier ensemble de ressources ayant 

les plus grands scores de pertinence, 

- siirveiller les nouveaux liens qui apparaissent dans lesdites regions pertinentes et qui pointent 
vers de nouvelles ressources (c'est-a-dire vers des ressources qui n'^taient pas encore connues du 

systeme), 

10 - selectionner un deuxieme ensemble de ressources ayant un score de pertinence (tel que le score 
autoritd) 61ev6 pour ladite requete, 

- selectionner les nouvelles ressources qui sont les plus similaires aux ressources dudit deuxieme 
ensemble de ressources et donner aux nouvelles ressources selectionnees un score autorite 
dependant du temps (comme d6crit ci-apres) en fonction de leur similarity aux ressources dudit 

1 5 deuxidme ensemble de ressources. 

La similarity d'une ressource par rapport k d'autres ressources est d^termin^e en comparant leurs 
contenus. On decrit ci-aprfes comment determiner la similarity en fonction de la distribution des 
mots dans les ressources en question. 

Score autority dypendant du temps : 

20 Chaque nouvelle ressource autorite a un score autorite hypertexte (aht) et un score autority 
similarity (Bs). Soit x le rapport entre 

- le temps restant pour que la ressource en question ne soit plus considerye comme ytant nouvelle 

- et la durye totale de nouveauty (c'est-a-dire la durye totale pendant laquelle une ressource qui 
vient d'Stre dycouverte par le syst&me est considyrye comme nouvelle). 

25 X est done un nombre egal 4 1 au dybut de la vie d'une ressource dans le systeme, et dycroit 
linyairement jusqu'a atteindre 0 au moment ou Ton dit que la ressource en question est vieille.. 

Ainsi X est utilise comme une pondyration pour passer progresi vement d'un score similarity a un 



score hypertexte et la formule du score global est |a = Tas-H:^ahd (avec x'=l -x). 

Comme la distribution des mots d'une nouvelle ressource varie en principe moins que les liens 
30 hypertextes qui pointent vers elle, on considere que as est constant tandis que att doit Stre mise k 
jour dans le temps. Ainsi le score a^ doit etre calcuiy au moment ou la nouvelle ressource est 
dycouverte, et pour toutes les requites pour lesquelles elle est dans une rygion pertinente, jusqu'a 
qu'elle devienne vieille (ainsi si un lien vers cette ressource apparait dans une region pertinente 
apr^s qu'elle soit devenue vieille, alors on ne dyterminera pas sa similarity avec les ressources 
35 dudit deuxidme ensemble). 

Similarity : 

On va utiliser un algorithme de distillation absolue pour dyterminer le score as de chaque 
nouvelle ressource. 

Le procydy connu de distillation absolue sur un ensemble de noeuds reliys par des liens (formant 
40 ainsi un graphe orienty) comprend les ytapes suivantes : 
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1- A chaque noeud attribuer un score pivot 6gal k 1 ainsi qu*un score autorit6, 

2- pour chaque noeud calculer son score autorit^ en additionnant les scores pivots des noeuds qui 
pointent vers lui, ensuite normaliser les scores autoritfe de manifere a ce que leur total soit 6gal h 

5 3- pour chaque nceud calculer son score pivot en additionnant les scores autoritfo des ncsuds vers 
lesquels il pointe, ensuite normaliser les scores pivots de maniere a ce que leur total soit 6gal a 1, 

4- it6rer en reprenant k partir de T^tape 2 jusqu*^ que Talgorithme converge, c*est-a-dire jusqu*^ 
oe que les scores ne soient plus significativement difF^rents par rapport k T^tape pr^c^dente. 

Ici les liens sont en plus pond6r6s par les similarites des ressources en question par rapport a la 
iO distribution de leurs mots. Les etapes 2 et 3 sont remplacees par les suivantes : 

2'- pour chaque noeud calculer son score autorit^ en additionnant les scores pivots des noeuds qui 
pointent vers lui multiplies par le poids des liens respectifs, ensuite normaliser les scores 
autoritfe de manidre a ce que leur total soit egal a 1, 

3'- pour chaque nceud calculer son score pivot en additionnant les scores autoritds des noeuds 
15 vers lesquels il pointe multiplies par le poids des liens respectifs, ensuite normaliser les scores 
pivots de maniere k ce que leur total soit ^gal a 1^ 

Le poids du lien de similarity «ntre deux ressources est 6gal au produit scalaire de leurs 
distributions de mots (c*est-a-dire k la somme, pour chaque mot qui se trouve dans les deux 
ressources, du produit des frequences de ce mot dans ces ressources ; la somme resultante est un 
20 nombre entre zero — cas ou il n'y a aucun mot en commun - et 1 ~ cas ou les deux ressources on 
le mSme contenu) aprds avoir 6t6 les mots non significatifs (« stop words » en terminologie 
anglo-saxonne). 

II est a noter que les liens de similarity ainsi obtenus sont bidirectionnels. 
Amsi, on peut ainsi effectuer la distillation absolue, sur Tensemble des ressources comprenant : 
25 - la nouvelle ressource d6couverte, 

- et ledit deuxidme ensemble de ressources ayant des scores de pertinence Aleves, 
pour determiner le score a, de cette nouvelle ressource d^couverte. 

Les proc^des decrits ci-dessus permettent egalement de selectionner, parmi un ensemble de 
ressources supplementaires, une ressource qui est la plus pertinente par rapport a une ressource 
30 de depart. 

A cet effet, on met en oeuvre les trois Stapes suivantes : 

(a) selection dans le Web de ressources les plus similaires k la ressource de depart (typiquement 
une ressource priv6e), par Tune des m6thodes de T invention, 

(b) selection dans le Web de ressources les plus pertinentes par rapport aux ressources 
35 selectionn^es a Tetape (a), et 

(c) selection de ressources supplementaires (typiquement des ressources privees k nouveau) les 
plus similaires aux ressources les plus pertinentes s61ectionnees k I'^tape (b). 

Un tel precede permet notamment de generer dynamiquement le contenu de pages Web publiees 
en fonction du contexte. 
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REVENDICATIONS 

1. Proced^ pour determiner des ressources additionnelles pertinentes par rapport a un 
ensemble donn6 de ressources de depart, caractdris6 en ce quMI comprend les €tapes suivantes : 

5 a) identifier un ensemble de ressources citantes constitutes par toutes les ressources ayant 

tun lien vers au moins Tune des ressources de depart, 

b) former un ensemble de ressources candidates constitue par Tensemble des ressources 
citees par les ressources citantes, 

c) pour chaque ressource candidate, calculer un score de pertinence de ressource 
10 candidate entre ladite ressource candidate et I'ensemble de ressources de depart sur la base de 

Texistence de liens situes dans les ressources citantes et dirig6s vers la ressource candidate et 
vers les ressources de depart, et sur la base egalement de scores de pertinence de ressources 
citantes ^fecfes k chacune des ressources citantes, 

d) pour chaque ressource citante, recalculer un score de pertinence de ressource citante 
i5 5ur la base de 1 'existence, dans la ressource citante en question, de liens vers les ressources 

candidates ^t sur la base egalement des scores de pertinence de ressource candidate attributes 
aux ressources candidates d I'ttape c), 

e) repeter le cas echeant I'etape c) et le cas tcheant une ou plusieurs fois I'etape d) puis 
rttape c) 

20 f) determiner lesdites ressources additionnelles pertinentes comme ttant les ressources 

candidates qui pr&enlent les meilleurs scores de pertinence de ressource candidate. 

2. Procede selon la revendication 1, caracttrise en ce que le calcul de score de pertinence 
effectue a Tetape c) comprend le calcul d'une pluralite de sommes de scores de pertinence de 
ressources citantes, chaque somme comprenant uniquement les scores de pertinences des 

25 ressources citantes comprenant un lien vers une ressource donnee constitute par la ressource 
candidate ou une ressource de depart. 

3. Procedt selon la revendication 2, caracterist en ce qu'il comprend tgalement le calcul 
d'au moins une somme de scores de pertinence de ressources citantes, chaque somme 
comprenant uniquement les scores de pertinences des ressources citantes comprenant un lien vers 

30 fune parmi un ensemble d'au moins deux ressources donntes, cet ensemble comprenant la 
ressource candidate et au moins une ressource de dtpart, 

4. Procedt pour determiner des ressources additionnelles pertinentes par rapport a un 
ensemble donnt de ressources de dtpart, caracttrist en ce qu'il comprend les ttapes suivantes 

a) identifier un ensemble de ressources cittes constitutes par toutes les ressotirces ayant 
35 un lien depuis au moins Pune des ressources de dtpart, 

b) former un ensemble de ressources candidates constitut par I'ensemble des ressources 
citant les ressources citees, 

c) pour chaque ressource candidate, calculer un score de pertinence de ressource 
candidate entre ladite ressource candidate et I'ensemble de ressources de depart sur la base de 

40 Pexistence de liens situts dans la ressource candidate et dans les ressources de dtpart et dirigts 
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vers les ressources cities, et sur la base ^gatement de scores de pertinence de ressources citdes 
affect^s a chacune des ressources cit6es, 

d) pour chaque ressource cit^e, recalculer un score de pertinence de ressource cit6e sur la 
base de I'existence, dans la ressource cit^e en question, de liens depuis les ressources candidates 

5 «t sur la base 6galement des scores de pertinence de ressource candidate attribuees aux ressources 
candidates k I'^tape c), 

e) v€p6tcv le cas 6ch6ant r6tape c) et le cas ech6ant une ou plusieurs fois T^tape d) puis 
i'^tape c) 

f) determiner lesdites ressources additionnelles pertlnentes comme 6tant les ressources 
10 candidates qui pr6sentent les meilieurs scores de pertinence de ressource candidate. 

5. Systdme de navigation parmi des ressources d' information, chaque ressource comprenant 
au moins un lien activable dans un premier mode par un dispositif d'entree pour provoquer 
Tacces a une autre ressource d' informations designee par un identificateur de ressource associe a 
ce lien, caract6ris6 en ce qu'au moins certaines ressources comprennent au moins un lien 

15 activable dans un second mode^ Paide d'un dispositif d*entr6e pour envoyer a un moteur de 
recherche de nouvelles ressources d' informations une requSte de recherche contenant 
IMdentificateur de ressource associe au lien en question. 

6. Systeme selon la revendication 5, caracteris6 en ce que le dispositif d'entr^e est apte a 
activer le lien simultandmentdans les premier et second modes. 

20 7. Systfeme selon la revendication 5, caract6ris6 en ce que Tactivation du lien dans le second 
mode est apte a provoquer I'affichage d'une requete pr6-existante, k laquelle IMdentificateur de 
ressource associ6 au lien en question est susceptible d'etre ajoute. 

8. Systeme selon les revendications 6 et 7 prises en combinaison, caract6rise en ce que 
Tactivation du lien dans le second mode est apte a afficher, en plus de la requete pr6-existante, la 

25 ressource dMnformations ddsign^e par ledit identificateur de ressource. 

9. Systfeme de recherche de nouvelles ressources d' information k partir de ressources 
dMnformations existantes, caract6rise en ce qu'il comprend un moteur de recherche base sur 
I'analyse de liens entre diffSrentes ressources et acceptant en entree une requete comprenant une 
serie dMdentificateurs de ressources, un moyen de selection d'identificateurs apte a memoriser un 

30 ensemble d'identificateurs (URI) de ressources selectionnfe les uns apres les autres par un 
utilisateur, et un moyen generateur de requete activable par Tutilisateur pour engendrer une 
requSte contenant Tensemble des identificateurs pr6c6demment s^lectionnes a destination du 
moteur de recherche. 

10. Systeme selon la revendication 9, caract^ris^ en ce que le moyen de selection est apte a 
35 memoriser les identificateurs s^lectionn^s de maniere remanente, de telle sorte que le moyen de 

selection puisse etre mis en oeuvre de fa9on espac^e dans le temps en vue de la g6n6ration d'une 
m6me requSte. 

11. Proced6 de recherche de nouvelles ressources d' information k partir de ressources 
dMnformations existantes, caract^rise en ce qu'il comprend la mise en oeuvre d'un moteur de 

40 recherche has6 sur I'analyse de liens entre difKrentes ressources et acceptant en entr6e une 
requSte comprenant une s6rie dMdentificateurs de ressources et en ce qu'il comprend les 6tapes 
suivantes : 
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- selection dMdentificateurs (URI) de ressources ies uns aprts les autres par un 
utilisateur ; 

- generation d'une requete contenant I'ensemble des identificateurs pr6c6demment 
selectionnes a destination du moteur de recherche. 

5 12. Proc6de de recherche de nouvelles ressources d'information a partir de ressources 
d' informations existantes, caract^ris^ en ce quMl comprend la mise en oeuvre d'un moteur de 
recherche bas6 sur Tanalyse de liens entre diff^rentes ressources et acceptant en entree une 
requete comprenant une sefie d'identificateurs de ressources et en ce qu'il comprend les etapes 
suivantes : 

10 . generation d'une requete contenant un ensemble dMdentificateurs de ressources 

prec^demment m^moris^s dans un meme groupe d'identificateurs de ressources propre k un 
utilisateur, k destination du moteur de recherche, 

- generation d'une signalisation a ^attention de I'utilisateur lorsqu'au moins un nouvel 
identificateur de ressource appartenant au groupe en question a ^e trouv^ par le moteur. 

15 13. Proc6de selon la revendication 12, caracteris6 en ce que chaque groupe d'identificateurs 
de ressources est repr6sente par un objet graphique sur un dispositif d'affichage de I'utilisateur, 
et en ce que ladite signalisation est r^alis6e au moins par changement d*apparence de cet objet 
graphique. 

14. Procede de gestion de ressources dans un systeme informatique pourvu d'un ecran 
20 d'affichage et d'un dispositif d'entr^e pour deplacement et actionnement de curseur tel qu'une 

souris, diaque ressource possedant une reprSsentation affichee sur I'ecran de maniere a pouvoir 
etre d6plac6e a Paide du dispositif d'entr6e, proc6d6 caract6ris6 en ce qu'il comprend les etapes 
suivantes : 

- deplacement de la representation d'une premiere ressource pour Pamener au-dessus de 
25 la representation d'une seconde ressource, 

- puis memorisation, dans une m^moire de gestion associative de ressources, 
d' informations d'association entre les premiere et deuxieme ressources. 

15. Precede selon la revendication 14, caracterise en ce que Petape de deplacement est 
effectuee par une technique de glisser-deposer. 

30 16. Procede selon la revendication 14 ou 15, caracterise en ce qu'il comprend en outre, suite 
a Pidentification d'une ressource donnee dans un processus de consultation de ressources, les 
etapes suivantes : 

- lecture de la memoire de gestion associative de ressources pour determiner si k ladite 
ressource donnee sont associees d'autres ressources, et 

35 - dans Paffirmative, signalisation sur Pecran d'affichage de Pexistence de la ou des 

ressources associees. 

17. Procede selon I'une des revendications 14 a 16, caracterise en ce que les ressources 
comprennent des fichiers. 

18. Procede selon Pune des revendications 14 k 17, caracterise en ce que les ressources 
40 comprennent des ressources accessibles par un reseau tel que PIntemet. 
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19. Proc6de selon la revendication 16, caracteris6 en ce que ridentification d'une ressource 
donn^e est obtenue par un processus d' identification de ressources similaires ou pertinentes par 
rapport a au moins une ressource de depart. 

20. Proc6de selon la revendication 16 ou 19, caracteris6 en ce que, dans le cas ou la lecture de 
5 la m6moire de gestion associative determine Texistence de plusieurs ressources associ6es, Tdtape 

de signalisation comprend la signalisation ordonn^e d'au moins une partie desdites plusieurs 
ressources associ^es. 

21 • Procede selon la revendication 20, caract6ris6 en ce que la signalisation ordonnee est 
bas6e sur la determination de scores de pertinence desdites ressources associ^es. 

10 22. Proc6d6 selon Tune des revendications 14 k 21, caracteris^ en ce que la memoire de 
gestion associative de ressources est contenue dans un serveur accessible k partir d'une plurality 
de postes individuels dans lesquels I'etape de deplacement peut etre mise en oeuvre. 

23. Precede selon la revendication 22, caracteris6 en ce que les associations entre ^ressources 
sont memoris^es utilisateur par utilisateur. 
15 24. Procede selon la revendication 22, caract6ris6 en ce que les associations entre ressources 
sont m^morisees de fa9on mutualis6e entre plusieurs utilisateurs. 

25. Proc6d6 pour identifier a partir d'une ressource de texte, une partie de ladite ressource 
susceptible de constituer une requete significative pour un moteur de recherche, caracterise en ce 
qu'il comprend les etapes suivantes : 

20 - oter du texte les mots non significatifs ; 

- etablir et completer une m6moire de liens entre parties dudit texte, ou une partie est liee k une 
autre quand elle contient au moins un mot significatif en commun ; 

- mettre en oeuvre un pvoc6d6 de determination de scores de ressources par analyse d*un graphe 
de noeuds de ressources relics par des liens, ou chaque ressource utilisee dans ce proced6 est 

25 constitute par une partie du texte, sur les parties de texte ainsi liees entre elles ; 

- utiliser au moins Time des parties de texte constitutes par les ressources candidates determintes 
par ledit procede comme texte de requete ou comme base pour un texte de requSte. 

26. Procede selon la revendication 25, caracttrist en ce que rttape de mise en ceuvre du 
proctdt selon Tune des revendications 1 a 4 est effectute seulement avec des parties de texte 

30 stlectionntes comme preponderantes, ou les parties de texte citantes sont les parties de texte qui 
comprenant au moins un mot en commun avec la ou les parties de texte preponderantes, oft un 
lien est ct66 k partir de chaque partie de texte citante vers la ou les parties de texte 
preponderantes, oil les parties de texte contenant au moins un mot egalement contenu dans les 
parties de texte citantes sont identifiees, pour former un groupe de parties de texte co-citees, et oix 

35 est temporairement cree un lien k partir de chaque partie de texte citante vers chaque partie de 
texte co-citee avec laquelle ladite partie de texte citante poss^de au moins un mot en commun. 

27. Procede selon Tune des revendications 25 et 26, camct6rise en ce que les parties de texte 
sont des phrases. 

28. Precede de gestion de ressources d'information telles que des pages Web dans un 
40 systeme informatique comprenant un poste utilisateur dote d'un ecran d'affichage, chaque 

ressource possedant un identifiant (URI) permettant son accts k partir du poste utilisateur, 
procede caracterise en ce quMl comprend les etapes suivantes : 
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(a) declaration par I'utilisateur d'une association entre deux ressources, en associant a une 
deuxifeme ressource ridentificateur d'une premiere ressource ; 

(b) identification d'autres ressources pertinentes par rapport a la deuxieme ressource ; et 

(c) lors de Taccfes k Tune des autres ressources (page courante\ signalisation de 
5 Texistence de la premiere ressource. 

29. Proc6d6 selon la revendication 28, caracterise en ce que i'etape (b) comprend la selection 
d'autres ressources les plus pertinentes pour la mise en oeuvre de I'^tape (c). 

30. Proc^dd selon Tune des revendications 28 et 29, caract^ris^ en ce que T^tape (a) est mise 
en ceuvre pour une plural ite de deuxiemes ressources appartenant a un groupe, et en ce que 

10 I'dtape (b) comprend T identification d'autres ressources pertinentes par rapport a Tensemble des 
deuxiemes ressources du groupe. 

31. Proc^de selon Tune des revendications 28 a 30, caract6ris6 en ce que T^tape (b) est 
d^clench^e par la realisation de T^tape (a). 

32. Procdde selon Tune des revendications 28 a 30, caracterise en ce que Tetape (b) est mise 
15 en ceuvre posterieurement a I'acces prevu h Tetape (c) pour determiner si Tautre ressource a 

laquelle il a ete accede est une autre ressource pertinente par rapport k la deuxieme ressource. 

33. Proc^de selon Pune des revendications 28 k 30, caracterise en ce que I'etape (b) est mise 
en GBuvre par foumiture d'un identificateur de la deuxieme ressource k un serveur de 
determination de ressources pertinentes. 

20 34, Procede selon Tune des revendications 28 a 33, caracterise en ce que Tetape (b) est mise 
en ceuvre par identification d'autres ressources pertinentes par rapport a au moins une ressource 
intermediaire {spot) par rapport k laquelle la deuxieme ressource est predeterminee comme etant 
pertinente. 

35. Procede selon Tune des revendications 28 a 34, caracterise en ce qu'il comprend en outre 
25 Taffichage, au voisinage d'une zone d'affichage de ressources, de representations de liens vers 

au moins certaines parmi les premieres ressources, les ressources intermediaires, et des 
ressources pertinentes par rapport aux ressources intermediaires. 

36. Procede selon Tune des revendications 28 a 35, caracterise en ce que I'etape (a) est mise 
en ceuvre par action a I'aide d'un dispositif d'entree sur des objets graphiques representatifs des 

30 premiere et deuxieme ressources. 

37. Procede pour identifier des ressources d' informations accessibles par liens (telles que des 
pages Web) recentes, pertinentes par rapport k au moins une ressource donnee, caracterise en ce 
qu'il comprend les etapes suivantes : 

- appliquer une requete comprenant un identificateur de ladite ressource donnee k un systfeme de 
35 determination de pertinence entre ressources, 

- seiectionner un premier ensemble de ressources les plus pertinentes (e.g. meilleurs scores 
pivots) par rapport k ladite ressource donnee, 

- rechercher, dans chacune des ressources les plus pertinentes, des regions possedant des liens 
vers d'autres ressources de pertinence eievee en moyenne, dites regions pertinentes, 

40 - surveiller T apparition, dans lesdites regions pertinentes, de nouveaux liens qui pointent vers des 
ressources qui n'etaient pas encore connues du systeme, dites nouvelles ressources. 
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- selectionner un deuxifeme ensemble de ressources ayant una pertinence 61ev6e (e.g. meilleurs 
scores autorite hypertexte) par rapport a ladite ressource donn^e, 

- selectionner les nouvelles ressources qui ont une similarite de contenu la plus 61ev6e par rapport 
aux ressources dudit deuxi^me ensemble de ressources et donner aux nouvelles ressources 

5 s61ectionn6es un niveau de pertinence (score autorite de similarite) dependant du temps en 
fonction de ladite similarity de contenu. 

38, Proc6d6 pour permettre Paccfes par un utilisateur k des d'entit6s d' informations 
pertinentes a partir d'une entite d' informations de depart, chaque entite dMnformations etant 
accessible par un identifiant (URI), caract6ris6 en ce qu'il comprend les 6tapes suivantes : 

10 a) pr6voir au moins une entite d' informations similaire, pr^sentant un contenu similaire k celui de 
Tentit^ de depart, et determiner Tidentifiant de la ou de chaque entity d'informations similaire, et 

b) determiner k partir du ou de chaque identifiant d' entity dMnformations similaire un ensemble 
d'un ou plusieurs identifiants d'entites d*informations pertinentes par rapport a la ou chaque 
entite d' informations similaire. 

15 39. Proced6 selon la revendication 38, caracterise en ce qu'il comprend en outre I'iStape 
suivante : 

c) permettre k Tutilisateur Taccfes k au moins certaines informations pertinentes k partir de leurs 
identifiants respectifs, 

40. Proc6d6 selon la revendication 38 ou 39, caract6ris6 en ce qu'il comprend en outre T^tape 
20 suivante : 

d) a partir des identifiants d*entit6s d'informations pertinentes et d'un ensemble donn6 d'entit6s 
d'informations supplementaires, selectionner les entit6s supplementaires les plus similaires aux 
entit6s d' informations pertinentes. 

41. Proc^de selon Tune des revendications 38 a 40, caracterise en ce qu'il comprend une 
25 etape supplementaire de tri des entites d'informations pertinentes par degr6 de pertinence. 

42. Proc^de selon la revendication 41, caracteris6 en ce que I'etape de tri est precedee d'une 
etape de calcul d'un score de pertinence par rapport a la ou chaque entite d'informations 
similaires pour chacune des entites d'informations pertinentes. 

43. Proc^de selon Pune des revendications 38 k 42, caract6ris6 en ce que chaque entit6 
30 d'informations est constitute par un fragment de page 6crite en langage de marquage normalise, 

ou par une telle page dans son ensemble. 

44. Procede selon la revendication 43, caracterise en ce que chaque identifiant est constitue 
par un identificateur uniforme de ressource (URI) du fragment ou de la page. 

45. Procede selon Tune des revendications 38 k 44, caracterise en ce que retape a) est 
35 realisee par selection par I'utilisateur d'une ou plusieurs entites d'informations similaires k 

I'entite d'informations de depart. 

46. Procede selon I'une des revendications 38 a 44, caracterise en ce que I'etape a) est 
realisee par mise en oeuvre d'un processus de determination automatique d' entites d'informations 
similaires. 

40 47. Procede selon I'une des revendications 38 k 44, caracterise en ce que I'etape a) est 
realisee par mise en oeuvre d'un processus de determination automatique d'entites d'informations 
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similaires, suivie d'une selection par Tutilisateur d'une ou plusieurs entit^s dMnformations 
similaires parmi les entit6s d'informations similaires d6termin6es par ledit processus. 

48. Proc6d6 selon Tune des revendications 38 k 47, caracteris6 en ce que I'^tape b) est 
r^alis^e par mise en CKUvre d'un processus de determination automatique d'entit6s d*informations 

5 pertinentes. 

49. Proc6d6 selon la revendication 48, caract6ris6 en ce que le processus de determination 
automatique d'entites d'informations pertinentes comprend Tanalyse d'une structure de graphe 
d'identifiants constitute par les identifiants d'entites d' informations et par les identifiants 
d6signes par des liens activables par I'utilisateur contenus dans lesdites entitts d' informations. 

10 50. Proc6d6 pour determiner des scores de pertinence d*unit6s de texte telles que des phrases 
dans un document textuel, caract6ris6 en ce qu'il comprend les Stapes suivantes : 

- decomposition du document en une pluralit6 d'unites de texte, 

- selection d'au moins une unite de texte pertinente et d'unites de texte candidates, 

- determination de Tensembledes mots signifiants contenus dans I'unite (ou les unites) de 
1 5 texte pertinente(s) et dans chacune des unites de texte candidates, 

- pour chaque mot signifiant contenu dans I'unite (ou les unites) de texte pertinente(s), 
identification des unites de texte candidates citant ce mot signifiant, pour former un groupe 
d'unites de texte citantes, 

- identification des unites de texte candidates contenant au moins un mot signifiant 
20 egalement cite dans les unites de texte citantes, pour former un groupe d'unites de texte co- 

citees, 

- affectation aux unites de texte co-citees un score de pertinence en fonction desdites 
citations. 

25 51, Procede pour determiner des scores de pertinence d'unites de texte telles que des phrases 
dans un document textuel, caracterise en ce quMl comprend les etapes suivantes : 

- decomposition du document en une pluralite d'unites de texte, 

- selection d'au moins une unite de texte pertinente et d'unites de texte candidates, 

- determination de I'ensemble des mots signifiants contenus dans I'unite (ou les unites) de 
30 texte pertinente(s) et dans chacune des unites de texte candidates, 

- pour chaque mot signifiant contenu dans I'unite (ou les unites) de texte pertinente(s), 
identification des unites de texte candidates comprenant ce mot signifiant, pour former un groupe 
d'unites de texte cites, 

- identification des unites de texte candidates contenant au moins un mot signifiant 
35 egalement cite dans les unites de texte cites, pour former un groupe d'unites de texte co-citantes, 

- affectation aux unites de texte co-citantes un score de pertinence en fonction desdites 
citations. 

52. Procede pour determiner des scores attribues a des mots ou groupes de mots contenus 
dans des unites de texte telles que des phrases dans un document textuel, caracterise en ce qu'il 
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comprend une etape qui consiste a additionner les scores de pertinences, d6termin6s selon Tune 
des revendications 50 et 51, des uhit& de texte dans lesquels lesdits mots se trouvent. 
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COMMON GROUND. CHI '96 CONFERENCE 

PROCEEDINGS. CONFERENCE ON HUMAN FACTORS 

IN COMPUTING SYSTEMS. VANCOUVER, APRIL 13 

- 18, 1996, CONFERENCE ON HUMAN FACTORS IN 

COMPUTING SYSTEMS. NEW YORK, ACM, US, 

13 avril 1996 (1996-04-13), pages 118-125. 

XP000657810 

ISBN: 0-201-94687-4 

page 118, colonne de gauche, dernier 

alin§a - colonne de droite, ligne 13 

BICHTELER J ET AL: "THE COMBINED USE OF 

BIBLIOGRAPHIC COUPLING AND COCITATION FOR 

DOCUMENT RETRIEVAL" 

JOURNAL OF THE AMERICAN SOCIETY FOR 

INFORMATION SCIENCE. AMERICAN SOCIETY FOR 

INFORMATION. WASHINGTON. US. 

vol. 31, no. 4, 

1 juillet 1980 (1980-07-01), pages 
278-282, XP002043307 
ISSN: 0002-8231 
abreg§ 

page 278, colonne de gauche, ligne 13 - 
colonne de droite, ligne 1 
page 278, colonne de droite, dernier 
alin§a - page 279, colonne de gauche, 
ligne 4 



1.4 



1.4 



Fdnnulaire PCT/ISA/210 (sufte de la deuxidme feullle) Quillet 1992) 



RAPPORT DE RECHERCHE INTERNATIONALE 



Demande Internationale rf 

PCT/FR 03/00089 



Cadre I Observations - iorsqu'll a 6t6 estlm6 que certalnes revendications ne pouvalent pas faire Tobjet d'une recherche 
(suite du point 1 de la premiere feuille) 



ConfbrmSment k Particle 17.2)a). certaines revendications n'ont pas fait robjet d'une recherche pour les motifs sulvants: 
^ ' ^ sl^^Snf ^ »'^ard duquel radminislration n'est pas tenue de proc^der a la recherche, a savoir: 



2- n sfr^porte^^^^ de la demande Internationale qui ne rempDssent pas sufflsamment les conditions prescrltes pour 

qu'une recherche significative pulsse Stre effectu6e, en partlculler: 



^' ' sont d^"reve^nd^^^ d6pendantes et ne sent pas redig6es conform^ment aux dispositions de la deuxi^me et de la 
trolsfeme phrases de la rSgle 6.4.a). 



Cadre II Observations - iorsqu'li y a absence d'unit6 de I'invention (suite du point 2 de la premiere feuille) 



L'administration chargee de la recherche Internationale a trouv6 plusieurs inventions dans la demande Internationale. ^ savoir: 

voir feuille supplemental re 

1 I — I Comme toutes les taxes addltionnelles ont 6t6 payees dans les d^lals par le dfeposant. le prdsent rapport de recherche 
I— I hteirrotionale porta sur toutes les revendte^ 

2 n Comme toutes les recherches portant sur les revendications qui s'y pretaient ont pu dtre eff ectuees sans effort partlculler 

j^^Sflantu^^^ 

3 I — 1 Comme une oartie seulement des taxes addttionnelies demandees a pay6e dans les d6lais par le d6posant. le present 
l_l ^pp^ de rech^^^^^^ ne porte que sur les revendications pour lesquelles les taxes ont 6t6 pay§es. & savoir 

les revendications n °^ 



4 m Aucune taxe addltionnelle demandSe rfa 6t6 pay6e dans les d^lais par le d^posant En consequence le present 
UU derechercha Internationale ne porte que sur rinvention mentionnie en premier lieu dans les revendications. eile est 
couverte par les revendications n 
1-4 



Remarque quant d la reserve Les taxes addltionnelles 6taient accompagn^es d'une reserve de la part du d6posan 

[ [ Le paiement des taxes addltionnelles n'6talt assort! d'aucune r6sen/e. 



Fomiulaire PCT/ISA/21 0 (suite de lapremidre feuille (1)) (Juillet 1998) 



Demande Internationale No. PCT/FR 03/G0089 



SUITE DES RENSEIGNEMENTS INPI QUESSUR PCT/iSA/ 210 

L' administration chargee de la recherche internationale a trouve 
plusieurs (groupes d*) inventions dans la demande internationale, 
a savoir: 

1. revendi cations: 1-4 

Procede pour determiner des ressources additionnelles 
pertinentes par rapport a un ensemble donne de ressources de 
depart 

2. revendi cations: 5-13 

Precedes et systeme de recherche de nouvelles ressources 
d* information a parti r de ressources d* informations 
exi stantes 

3. revendi cations: 14-24 

Procede de gestion de ressources d' informations dans un 
systeme informatique a I'aide d'une interface graphique 

4. revendi cations: 25-27 

Procede pour identifier une parti e d'une ressource 
susceptible de constituer une requete significative pour un 
moteur de recherche 

5. revendi cations: 28-36 

Procede de gestion de ressources d' informations dans un 
systeme informatique par association et suggestion de 
ressources 

6. revendi cation: 37 

Procede pour identifier des ressources d* informations 
recentes accessibles par liens et ayant un contenu similaire 
a une ressource donnee 

7. revendi cations: 38-49 

Procede pour permettre I'acces par un utilisateur a des 
entites d' informations pertinentes a parti r d'une entite 
d' informations de depart 



8. revendi cations: 50-52 



SUITE DES RENSEIGNEMENTS INDIQUES SUR PCT/ISA/ 210 



Precedes pour determiner des scores de pertinences attribues 
a des unites de texte dans un document textuel 



